512 k : archivage du flux RSS

Palaiseau, le lundi 22 mars 2021

Cher Journal,

jusqu'à présent, j'ai maintenu le flux RSS du site au complet, en ajoutant les entrées de journal depuis le 19 novembre 2018. Avec l'entrée d'hier, le flux a dépassé la taille de 512 kio. Cette taille, de nos jours, sur une ligne fibre, peut être considérée comme ridicule, et transférée quasiment instantanément. Toutefois, les lignes sont toujours très inégales : entre les gares, les hôtels, les liaisons satellites, les zones juste mal desservies, et les bricolages des radioamateurs, il y a probablement pas mal de situations où tout récupérer n'est pas très frugal.

Avoir les articles complets dans le flux permet une lecture hors ligne très pratique que j'affectionne particulièrement, mais envoyer le site web complet à chaque rafraîchissement ne me semblait plus franchement raisonnable. D'autant plus que, de nombreux lecteurs de flux vont évincer de leur cache les entrées les plus anciennes, notamment s'il y en a plus de cent, comme c'est le cas pour ce journal. J'ai donc déployé des flux figés (sic), afin d'archiver les années 2018, 2019, et 2020. Je conserverais les années courantes et précédentes dans le flux principal, histoire de permettre à tout un chacun de suivre le roulement sans se laisser surprendre ; il faudrait autrement rafraîchir sont flux RSS moins d'une fois par an pour se faire avoir et manquer des articles.

Techniquement, la construction des articles n'a rien eu de particulièrement ardu. J'ai juste ouvert le flux principal, copié les articles correspondant à l'année en cours d'archivage dans le nouveau fichier, et refait une en-tête Atom toute propre. Afin de ne pas régénérer, dans la mesure du possible, une pile d'articles non lus, j'ai bêtement copié et collé les sections du fichier Atom XML sans changer les identifiant uniques universels UUID. Avec newsboat en tout cas, les entrées d'archives sont reconnues comme déjà lues, et n'apparaissent plus dans le flux principal d'emblée. J'ai tout de même eu le bon goût de changer l'identifiant global du flux pour chaque archive, histoire que les lecteurs de flux ne se mélangent pas complètement les pinceaux non plus.

Je suis curieux de savoir comment se comportent les autres lecteurs de flux dans ce genre de situation ?

[ICO]NameLast modifiedSize
[PARENTDIR]Parent Directory  -

  —