Manifest open library
So we want you to imagine what would happen if we were citizens, students, contractors, researchers, teachers, journalists, designers (...) could access to public domain works in digital format. What would happen if the public library allowed us access to all public domain works? What would happen if we could do automatic searches on all these books? What would happen if we could all pay TV and work on these documents?
François PhD student. He received a state scholarship and often works at the library. This time, he wanted to read a book that has not yet been digitized. As this book is not fragile librarian sent him a copy. François then hastens to bring to the workshop scanner library. He can take care of the scanner in order to come away with a digital copy. A digital copy will remain in the database library for future applications.
[Here the manifesto : https://docs.google.com/document/d/1LZ9PuJ-FeSBgrRWyTB3MXVjbVYQn4ztyLj1-GazKhBc/edit#]
[French] A Snapshot of the Manifesto :
Pourquoi une Bibliothèque numérique libre, ouverte est nécessaire.
Contexte:
Ces dernières semaines, la question de l’accès à la connaissance et sa diffusion a été remise au premier plan. Le suicide d’Aaron Swartz le 11 janvier 2013 a suscité de vives réactions sur internet et les réseaux sociaux. De nombreux chercheurs ont réagi via le mouvement #pdftribute, tweetant des liens vers des articles sceientifiques en accès libre. En France, ces réactions font tristement écho au mécontentement grandissant soulevé par les accords plus qu’inquiétants récemment signés par la BnF. Le contenu de ces accords de numérisation avec l’entreprise ProQuest n’est que partiellement connu. On sait juste qu’ils donnent pour 10 ans l’exclusivité des droits des copies numériques à ProQuest, et que ces copies numériques ne seront disponibles en libre accès uniquement sur les postes de la NBF.
Manifeste:
Alors nous souhaitons imaginer avec vous ce qui aurait était possible si nous citoyens, étudiants, entrepreneur, chercheurs, enseignants, journalistes, designers (...) pouvions accéder aux oeuvres du domaine public en format numérique. Que se passerait -il si la bibliothèque publique nous permettait d’accéder à l’ensemble des oeuvres du domaine public ? Que se passerait-il si nous pouvions faire des recherches automatiques sur tous ces ouvrages ? Que se passerait-il si nous pouvions télé-verser tout ces documents et travailler dessus ?
François est thésard. Il a reçu une bourse d’état et travaille souvent a la bibliothèque. Cette fois-ci, il a souhaité lire un livre qui n’est pas encore numérisé. Comme ce livre n’est pas fragile le bibliothécaire lui a transmis l’exemplaire. François s’empresse alors de l’apporter à l’atelier scanner de la bibliothèque. Il peut ainsi s’occuper de le scanner afin de pouvoir repartir avec une copie numérique. Une copie numérique restera dans la base de donnée de la bibliothèque pour les prochaines demandes.
Nicolas, Designer passionné de poésie rêve de créer une application interactive pour téléphone mobile. Il souhaite créer une application qui permette aux touristes qui visitent la France de recevoir des textes poétiques mentionnant les lieux qu’il sont en train de visiter.
Gerome, Professeur d’histoire géographique souhaiterait demander à ces élèves de sélectionner et annoter les passages des livres qui parle de la guerre de Cent Ans. Il veut ainsi qu’ils se rendent compte que la manière dont cette guerre est écrite a évolué entre 1400 et 1700.
Jeanne, Ingénieur des mines, veut créer une entreprise qui propose de nouveaux services sémantiques à partir de ces milliers de livres de référence qui fondent la culture d’aujourd’hui. Ce service permet de faire des recherches pertinentes et inédites dans les contenus en langue française, il parait que Dassault souhaite déja racheter sa start up.
Andrée, sémiologue, a travaillé au MIT avec … Il souhaite analyser les périodes de censures dans l’histoire de France et leur impact sur la culture. Pour cela il se base sur les travaux de … qui a été précurseur dans l’analyse quantitative de la culture.
Abdelkader travaille à la RATP, il veut créer un nouveau produit qui permettra d’afficher des citations des classiques de la littérature dans les nouvelles rames de métro. Pour cela, il a créé un petit programme qui se connecte directement au site de la BNF.
Renan, historien, veut compléter ses recherches en histoire en analysant quantitativement la célébrité (de l’époque) des personnages qu’il étudie. Pour cela il cherche combien de fois sont cité les auteurs en question dans la période en question.
Marie, est linguiste, elle habite à la Guadeloupe et travaille sur les relations entre le créole et le français, pouvoir accéder aux données dans le domaine public est inestimable. Vous imaginez si comme au vingtième siècle elle aurait du se déplacer a Paris pour lire des livres en papier a la BNF ?
Eloïse est élève au collège. Grâce au site de la BNF elle peut aller voir à quoi ressemblent les livres et les documents historiques dont on lui parle en cours d’histoire ou de français.
Michel, ingénieur chez Thales, passe ses week-end a faire des traitement statistiques sur des gros corpus de données, sont rêve et de pouvoir cartographier dans le temps et l’espace l’ensemble des usages du mot “liberté” dans tout les livres de la BnF. Une fois fait pour un mot, tout les mots pourraient être cartographier par tout un chacun grâce au site qu’il aura mis en ligne.
Mathieu, 10 ans, écoute sa maman qui lui dit que “avant les gens parlaient mieux”, il voudrait vérifier en testant les quelques bases de programmation qu’il a sur les corpus de la BnF
Paul veut apprendre à ses nièces et neveux l’importance du contexte culturel et humain. Pour cela, il utilise une appli qui recense toutes les couvertures et préfaces d’un même livre depuis 1500 et les replace dans des éléments de contexte historique. Cela lui permet de leur montrer l’évolution des jugements et des représentations sur une même question.
L’état pour identifier ces utilisateurs a mis en place un système de recaptacha sur ses services en ligne, cela aide a numériser les parties non reconnues par le système de reconnaissance optique de caractères. Ces livres numérisés sont issus de l’open library contenant un catalogue immense de livres de toute langue dans une base de données librement accessible dans Internet. Les livres numérisés de la Bibliothèque Nationale Française permettent un ajout intéressant pour le partage de la culture française et de ses ressources internationalement.
Pour inventer ces histoires qui pourraient être celles de nos données publiques nous avons imaginé que les ouvrages étaient accessibles selon les conditions suivantes :
L’accès peut se faire en dehors de la bibliothèque. L’accès peut se faire par des automatisations L’accès est libre et gratuit pour tout citoyen Français.
Je veux pouvoir numériser les livres du domaine public qui m'intéresse quand je suis dans une librairie publique.
QUESTIONS OUVERTES:
- Est ce que les livres seront accessibles dans dix ans et si oui comment ? - Quelles sont les autres pistes qui ont été explorées, puisque les rapports de la Cour des Comptes soulignent que les rapports publics-privés sont souvent des très mauvaises opérations pour l’Etat ? [1] - Quelles sont les conditions monétaires du contrat, qui va être financé par les investissements d’avenir ? [On pourrait faire un ratio avec un nombre de scanners à 800€] - @henriverdier : Quid de l’Open data et Open access pour les oeuvres dans le domaines ? -
EXEMPLE CAS PRATIQUE : Si toutes les oeuvres numérisées étaient libres..
Activité de recherche : - Si j’ai accès aux livres écrits en France de 1400 a 1700, je pourrais étudier l’évolution des mots Français dans l’histoire . - Si j’ai accès aux ressources de la langue française je pourrais analyser les discours des médias en Français et la couverture médiatique sur un sujet. - Si j’ai accès à l’ensemble des oeuvres de medecine depuis le XVIe jusqu’au XXe siècle je pourrais étudier les mode de découvertes d’un médicament - Si j’ai accès aux oeuvres artistiques du domaine publique, je pourrais faire travailler mes élèves sur un motif pictural à travers les siècles dans une étude transversale - Si (...), je pourrais faire travailler mes élèves sur - Si (...), je pourrais étudier l’évolution de la pensée sur le sujet de (...) - Si (...), je pourrais faire une cartographie des oeuvres numériques Activité éducatives : - Si (...), je pourrais travailler avec mes élèves sur des textes canoniques - Si (...), je pourrais imprimer, modifier - Si (...), je pourrais parcourir les textes par simple curiosité, cultiver cette curiosité, me faire une idée du contexte d’un texte ou d’un évènement historique particulier. Ceci serait bien sûr un excellent moyen d’apprendre l’importance du contexte. Rendre de telles données accessibles au plus grand nombre serait donc un moyen de promouvoir l’auto-education et de d’aider le citoyen ou futur citoyen à developper des outils d’analyse plus fins. - Si (...), je pourrais voir à quoi ressemblent les documents historiques dont on me parle par exemple en cours d’histoire.
Activité économique : - Si (...), je pourrais créer une entreprise vendant des services de sémantisation basé sur ce corpus - Si (...), je pourrai étudier l’évolution des versions publiées d’un même livre au cours du temps
Mettre un lien vers les papiers de Jean-Baptiste Michel à cet endroit ?
>> Quels sont les livres ?
Arguments de ProQUest : sauver les livres il faut les numériser
Alternatives : - Pérenniser la connaissance - Pérenniser les livres par la résilience des acteurs (scanneurs/copieurs/lecteurs) - Quelles garanties / droit de regard du citoyen sur la connaissance Fr ?
Modèles économiques pour une bibliothèques numériques libres ? organisation d’un atelier le 11 février? si des personnes sont motivées..
-pour les livres qui ne sont pas fragiles, des projets citizen science pourrait se développer pour scanner les livres ⇒ s’appuyer sur le “crowdscanning” -invention d’activités économiques autour de la numérisation des livres
Qu’est ce que donnerait notre -
Droit à la reflexivité collective (==avoir accès à la totalité du corpus de textes ou du jeu de données dont on a besoin pour effectuer une réflexion sur l’évolution de la connaissance que ça contient) REFERENCES :
http://www.earlham.edu/~peters/fos/timeline.htm Aljazeera - The political consequences of academic paywalls Unesco - Global Open Access Portal http://www.scoop.it/search?q=BNF des travaux en science réalisés grâce à des livres numérisés Quantitative Analysis of Culture Using Millions of Digitized Books Quantitative analysis of culture using millions of digitized books http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3279742/pdf/nihms-329575.pdf
Réactions suite à l’annonce de l’accord de la BNF avec Proquest : http://www.savoirscom1.info/2013/01/18/non-a-la-privatisation-du-domaine-public-par-la-bibliotheque-nationale-de-france/?doing_wp_cron=1358813520.8861958980560302734375 http://www.abf.asso.fr/pages/interieur-contenu.php?categorieTOP=2&categorie=22&id_contenu=320&utm_source=twitterfeed&utm_medium=twitter
Déclaration d'amour au domaine public
communiqué de presse : Investissements d'Avenir : Deux partenariats d'envergure conclus pour la numérisation et la diffusion des collections de la Bibliothèque nationale de France (BnF) http://scinfolex.wordpress.com/author/calimaq/ http://www.publicdomainmanifesto.org/french la tribune dans libé : http://www.liberation.fr/medias/2013/01/24/bientot-expropries-du-patrimoine-commun_876517 le blog de Philippe Aigrain : http://paigrain.debatpublic.net/ quelques éléments économiques : http://www.leconomiste-notes.fr/dotclear2/index.php/post/2013/01/22/Encore-quelques-mots-sur-les-accords-BnF http://archive.org/stream/GuerillaOpenAccessManifesto/Goamjuly2008_djvu.txt http://eeb.chadwyck.com/marketing/about.jsp <<< Early European Books initiative http://www.actualitte.com/usages/privatisation-du-domaine-public-derive-mercantile-a-la-bnf-39715.htm article du monde: http://abonnes.lemonde.fr/technologies/article/2013/01/16/apres-la-mort-d-aaron-swartz-des-debats-sur-la-legislation_1817672_651865.html TED talks: http://www.ted.com/talks/jennifer_pahlka_coding_a_better_government.html http://www.ted.com/talks/beth_noveck_demand_a_more_open_source_government.html http://www.ted.com/playlists/13/open_source_open_world.html http://www.openedition.org/ http://www.item.ens.fr/index.php?id=14060 CYBERNARD exemple pour la recherche
Une bibliothèque numérique libre Europeana http://scinfolex.wordpress.com/2011/10/10/larchitecture-juridique-ouverte-deuropeana/
Le projet Internet Archive : http://fr.wikipedia.org/wiki/Internet_Archive
https://groups.google.com/forum/?fromgroups#!forum/science-liberation-front http://www.tagsistant.net/
The Google Books database continues to grow. For users outside the United States, though, Google must be sure that the work in question is indeed out of copyright under local laws. According to a member of the Google Books Support Team, "Since whether a book is in the public domain can often be a tricky legal question, we err on the side of caution and display at most a few snippets until we have determined that the book has entered the public domain."[4] Users outside the United States can however access a large number of public domain books scanned by Google using copies stored on the Internet Archive.[5]
--http://en.wikipedia.org/wiki/Google_Books
Communication : calimaq Tribune : rue 89 : Le monde : Actualitté Owni? Internet Actu Hypotheses relier Twitter :
PDF METADATA http://blog.matt-swain.com/post/25650072381/a-lightweight-xmp-parser-for-extracting-pdf-metadata-in 5382 tweet avec #pdftribute et au moins un lien ( source : http://pdftribute.net/ ) 2209 pdfs leaked ( source : http://edward.io/pdftribute/view.php ) pdfs : http://edward.io/pdftribute/view.php lien pour un parser pdf python : http://pypi.python.org/pypi/pdfminer/ http://dublincore.org/documents/dcmi-terms/
http://groups.google.com/group/science-liberation-front
Généraliser l’accès au Données de la recherche http://couperin.sciencesconf.org/ https://groupes.renater.fr/sympa