Utiliser des moteurs de recherche académiques gratuits

1 - Moteurs de recherche versus bases de données

Jusqu’en 2004, année du lancement du moteur de recherche académique Google Scholar, la recherche d’information scientifique sur internet passait par les bases de données bibliographiques pour la plupart payantes (comme les bases pluridisciplinaires Web of Science ou Scopus), auxquelles s’abonnent les établissements de recherche et d’enseignement supérieur (voir les fiches CoopIST : Choisir les sources d'information scientifique sur internet et Interroger les sources d'information sur internet).Aujourd’hui, la gratuité des moteurs de recherche sur internet et leur accès facile ont favorisé leur usage par tous. L’adoption rapide de Google Scholar par les scientifiques a concurrencé les bases de données bibliographiques. Celles-ci ont réagi en rendant leur utilisation plus aisée.
Le développement du libre accès aux résultats de recherche (publications, jeux de données) et aux métadonnées les décrivant (voir la fiche CoopIST : Agir pour le libre accès dans une institution de recherche) a accru la compétition entre les bases de données et les moteurs de recherche.

Les utilisateurs combinent les deux types d’outils :

  • les bases de données bibliographiques : leurs fonctionnalités poussées permettent de répondre à des requêtes complexes. Elles ont une couverture maîtrisée, liée à une stratégie éditoriale élaborée. La création, l’enrichissement, le stockage, la qualité et la valorisation de leur contenu (références bibliographiques, index d’auteurs, index des organismes d’affiliation des auteurs, des revues sélectionnées, thésaurus, etc.) passent par des opérations manuelles de sélection, de référencement, d’indexation, de classification et de contrôle qualité ;
  • les moteurs de recherche académiques, c’est-à-dire spécialisés dans les ressources documentaires scientifiques : ce sont plutôt des outils exploratoires, complémentaires aux bases de données scientifiques. Ils fouillent et indexent de manière automatique les contenus des bases de données librement accessibles (archives ouvertes de publications, entrepôts de données de recherche, bases de brevets gratuites…). Leur valeur ajoutée est liée à la sophistication de leurs traitements automatisés sur les contenus qu’ils indexent (métadonnées, texte intégral). Mais leur périmètre est imprécis et leur stratégie souvent peu transparente.