Archive | janvier 4th, 2018

Playing around with Google n-gram

exemple de recherche

exemple de recherche

Ngram Viewer est une application linguistique proposée par Google, permettant d’observer l’évolution de la fréquence d’un ou de plusieurs mots ou groupe de mots à travers le temps dans les sources imprimées (numérisées par Google).

L’outil est entré en service en 2010 et n’a malheureusement plus été mis à jour depuis 2013.

Le terme Ngram désigne dans ce contexte une suite de « n » mots1, ce qui n’est lié que faiblement à la notion de n-gramme.

L’outil Ngram de Google repose sur la base de données textuelles de Google Livres. Les textes issus de Google Livres sont classés en fréquence de séquences de mots (appelées ngrams) par année d’édition, chaque séquence de mots est alors affectée d’un « poids ».

Lorsque l’utilisateur demande une comparaison de plusieurs séquences de mots, l’outil trace alors des courbes permettant de comparer leur fréquence d’usage au cours du temps.

Un exemple de recherche via ce lien et pour les amoureux du Google Search, le détail d’une requête constitutive :

https://www.google.fr/search?

q=%22european+union%22&

tbm=bks&

tbs=cdr:1,cd_min:2000,cd_max:2000&

lr=lang_en

&gws_rd=cr

&dcr=0

&ei=QtpNWrHdB8zUkwWtoKGIBg

 

Posted in Clic0 commentaire