• En savoir plus

  • Catégories

  • Nuage de mots clés

    Digital Humanities ehess sciences humaines et sociales séminaire usa
  • Archives

  • Commentaires récents

  • Les moteurs de recherche en Sciences humaines et sociales (2)

    Publié dans Observatoire des usages, TIC-SHS par Marin Dacos le 30/06/2006 7:29

    La situation des moteurs de recherche en sciences humaines et sociales en France est simple, puisqu’elle se résume à deux initiatives.

    Mister est un moteur de recherche de l’Institut national de l’information scientifique et technique (INIST). Il semble prendre la suite du moteur de l’UREC qui a fermé ses portes, lui aussi. La spécificité de ce moteur était d’indexer surtout les sites institutionnels, au détriment de certains sites à fort contenus mais moins clairement rattachés à une institution française. Mister est plus pertinent, mais il ne semble pas avoir fait de choix disciplinaire ni être très réactif [27]. Mes différentes démarches auprès de ce moteur sont restées lettre morte. Mais je ne jetterai pas la pierre, car je sais trop le travail que représente la correspondance alimentée par un tel projet ! Sans doute cette situation évoluera-t-elle prochainement.

    L’autre initiative française s’appelle In-extenso.org. Depuis 2002, ce moteur de recherche était expérimental. Il a permis à Revues.org d’accumuler une expérience importante dans ce domaine, notamment en ce qui concerne la sélection des sites, le réglage des curseurs du moteur, l’élimination du bruit, les performances du serveur, etc. Depuis le 30 juin 2006, le moteur est désormais en version beta. Il est confortablement installé dans un splendide centre de calcul grâce à l’hospitalité du CCSD. Alors qu’en 2002 il avait fallu écrire des routines de conversion des métadonnées, en raison de l’extraordinaire diversité des situations, en 2006, il a été possible de procéder autrement. En effet, plusieurs portails proposent désormais des dépôts OAI (pour Open archives initiative), qui sont en général parfaitement structurés et permettent de distinguer les métadonnées entre elles (titre, auteur, résumé, etc.). Cela donne, du coup, un « étage OAI » qui n’indexe pas le texte intégral, mais les métadonnées de 119 834 documents scientifiques. Il est ainsi possible de mener des recherches spécialisées sur 19 dépôts repérés.

    1- ArchiveSIC (679 records)

    2- Bibliothèque nationale de France (36401 records)

    3- Cairn (4985 records)

    4- Canadian Bulletin of Medical History / Bulletin canadien d’histoire de la médecine (616 records)

    5- Cognitive Sciences Eprints Archive (2623 records)

    6- Ecole nationale des chartes (256 records)

    7- ENS LSH (109 records)

    8- Hal SHS (9237 records)

    9- http://dlc.dlib.indiana.edu/ (1199 records)

    10- http://eprints.vf.ba.dlr.de/ (132 records)

    11- Jean Nicod (434 records)

    12- Lyon 2 (38 records)

    13- MémSIC : Mémoires en Sciences de l’Information et de la Communication (85 records)

    14- Persée (46114 records)

    15- Psycoloquy (ISSN 1055-0143) (720 records)

    16- Revues.org (15380 records)

    17- Université de Reims (49 records)

    18- Université Paris X (16 records)

    19- Universite Lyon 2 – Cybertheses (761 records)

    Si vous connaissez d’autres dépôts, n’hésitez pas à les signaler.

    Bien entendu, ces dépôts ne résument en aucun cas le web SHS. C’est la raison pour laquelle nous avons ajouté un « étage web » à ce moteur. Cet étage s’appuie sur les 2300 sites indexés dans l’Album des sciences sociales… et indexe du coup 1.500.000 pages web. Il s’agit de sites de laboratoires, de publications, de musées, de sites de chercheurs, etc. On peut espérer que cette sélection serrée permette à un étudiant de lancer une recherche sur l’avortement ou sur Jeanne d’Arc sans tomber sur les ligues anti-avortement ou sur les corvettes portant le nom d’une pucelle d’Orléans… Bref, un peu moins de documents, un peu plus de sélection, un peu moins de bruit, un peu plus de qualité que les monstres généralistes, dont l’utilité est certaine, mais qui ne parviennent pas à couvrir les besoins d’un scientifique ou d’un curieux exigeant. Un moteur spécialisé, de ceux dont on peut espérer la multiplication à l’avenir. Un moteur en devenir, surtout, qui attend votre contribution. En effet, nous avons ouvert la rédaction de l’Album à des coopérations extérieures, et nous annoncerons bientôt la constitution d’une équipe élargie, concentrée sur l’alimentation d’un répertoire principal et de multiples sous-répertoires, qui, tous, alimentent In-extenso.org

    Ce type de travail est à la fois éditorial et documentaire, il impose de prendre en compte la qualité intrinsèque du site, sa qualité techniques et les risques de bruit à l’indexation. N’hésitez pas à nous signaler des résultats du moteur de recherche qui comportent des documents inadaptés à l’ambition scientifique qui l’anime. La période est propice aux réglages, aux ajustements et, tout simplement, à l’apprentissage d’un nouveau métier. Lorsque nous prenons en compte votre proposition de modification du corpus, il faut 7 à 10 jours de délai pour que le moteur les prenne en compte. Lorsqu’on manipule de tels index, il faut savoir prendre son temps, accepter un petit peu de bruit dans les résultats et, sans cesse, remettre son ouvrage sur l’établi.

    3 commentaires pour “Les moteurs de recherche en Sciences humaines et sociales (2)”

    1. declicjardin dit :

      Merci la prochaine fois de me contacter avant d’utiliser un de mes visuels.
      declicjardin

    2. Marin dit :

      Bonjour,

      Vos images étaient en licence Creative commons, ce qui autorisait à utiliser l’image et n’obligeait pas à vous écrire. Bien sûr, cela aurait été plus courtois, et je ne l’ai pas fait seulement par manque de temps, mais j’avais pris le soin de placer un lien vers votre site, en plus du signalement de l’auteur, de façon à vous amener des visites et à ce que vous puissiez nous trouver, ce que vous avez manifestement fait.

      Je constate que vous avez modifié la licence de votre image, qui n’est plus en Creative commons désormais. Je me vois donc contraint de la retirer du site.

      Cordialement

    3. declicjardin dit :

      merci d’avoir pris le temps de répondre.Effectivement c’est une façon de diffuser mon travail et je vous en remercie.
      Cordialement
      Franck

    Laisser un commentaire