Google Books'da "Ngram Viewer" vositasini qanday ishlatish kerak

N gramm, odatda N grammi deb nomlangan, matndagi yoki nutq tarkibidagi matndagi statistik ma'lumotlarning n (sonini) topish uchun. Fonemalar, prefikslar, iboralar yoki harflar kabi har xil narsalar bo'lishi mumkin. N-gramm tadqiqotchining tashqarisida yashiringan bo'lsa-da, u aslida turli sohalarda qo'llaniladi va odamlar tabiiy til bilan tushunadigan va javob beradigan kompyuter dasturlarini ishlab chiqadigan ko'plab natijalarga ega. Buning ma'nosi, Googlening g'oyaga qiziqishi bo'lishi mumkin.

Google Books Ngram Viewer dasturida tahlil qilinadigan matn Google kitoblari qidiruv tizimini to'ldirish uchun ommaviy kutubxonalardan skanedan juda ko'p kitoblardan iborat. Google Books Ngram Viewer uchun, siz qo'ng'iroq qilmoqchi bo'lgan matnni "korpus" deb atashadi. Ngram Viewer-ning ingliz va amerika ingliz tilini alohida tahlil qilish yoki ularni birlashtirishi mumkin bo'lsa-da, Ngram Viewer-da ingliz tili tilga bo'lingan. Bu inglizlardan shartlarni ishlatish uchun AQShdan almashish va grafiklarni o'zgartirishni ko'rish juda qiziqarli bo'ladi.

Ngram qanday ishlaydi?

  1. Google Books Ngram Viewer sahifasiga books.google.com/ngrams sahifasida o'ting.
  2. Google veb-qidiruvlardan farqli o'laroq, buyumlar sezgirdir, shuning uchun tegishli otlarni sarflang.
  3. Tahlil qilmoqchi bo'lgan har qanday iboralarni yoki iboralarni kiriting. Har bir iborani vergul bilan ajratib qo'ying. Google sizni "Albert Eynshteyn, Sherlock Xolms, Frankenshteyn" deb taklif qiladi.
  4. Keyin sana oralig'ini kiriting. Sukut 1800 dan 2000 yilga to'g'ri keladi, ammo so'nggi paytlarda yangi kitoblar mavjud (2011 yil Google hujjatida eng so'nggi ro'yxatga olingan, ammo bu o'zgargan bo'lishi mumkin.)
  5. Biror korpusni tanlang. Siz xorijiy tillardagi matnlarni yoki ingliz tilini qidirishingiz va standart tanlovlardan tashqari, pastda "Ingliz tili (2009) yoki Amerika Ingliz tili (2009)" kabi narsalarni ko'rishingiz mumkin. Ular Google tomonidan yangilangan eski korporatsiya bo'lib, eski ma'lumotlar to'plamlariga qarshi taqqoslashni amalga oshirish uchun sizda ba'zi sabablar bo'lishi mumkin. Foydalanuvchilarning ko'pchiligi ularni e'tibordan chetda qoldirishlari va eng yangi korporatsiyaga e'tibor berishlari mumkin.
  6. Tozalash darajasini belgilang. Yumshatilish grafaning oxirida qanchalik silliqligini anglatadi. Eng aniq vakillik 0 darajasida silliqlash darajasigacha bo'lishi mumkin, ammo o'qish qiyin bo'lishi mumkin. Asl qiymati 3 ga o'rnatilgan. Ko'pgina hollarda, siz buni o'zgartirishingiz shart emas.
  1. Qidiruv kitoblari tugmachasini bosing. (Bundan tashqari, qidiruvni terish vaqtiga kiritishingiz mumkin.)

Ngram ko'rsatma nima?

Google Books Ngram Viewer vaqt ichida kitoblarda ma'lum bir iborani ishlatishni ifodalovchi grafikani chiqazdi. Agar bir nechta so'z yoki iborani kiritgan bo'lsangiz, turli xil qidiruv shartlariga zid keladigan rang kodli chiziqlarni ko'rasiz. Bu Google Trendsga juda o'xshaydi, faqat qo'ng'iroq uzoqroq vaqtni qamrab oladi.

Bu erda haqiqiy hayot misol bo'la oladi. Yaqinda sirka pyuresi haqida qiziqqan edik. Ular Laura Ingalls Wilder's Little House-ning Prairie seriyasida eslatilgan, lekin biz bunday narsalarni eshitmaganmiz. Biz sirka piesi haqida ko'proq bilib olish uchun avval Google veb-qidiruvidan foydalanganmiz. Ko'rinishidan, ular Amerikaning janubiy oshxonasining bir qismi hisoblanib, aslida sirkadan ishlab chiqariladi. Ular har yili hamma yillar mobaynida har bir yangi mahsulotga kirish imkoniga ega bo'lmagan paytlarga quloq solishdi. Bu butun xabarmi?

Biz Google Ngram Viewerni qidirgan edik va 1940 yillarning boshlarida ham, oxirlarida ham pirojnoe haqida ko'p gap bor edi, 1940-yillarda ko'p so'zlar va oxirgi paytlarda ko'plab so'zlar (ehtimol, ba'zi pirog nostalji). 1800-yillarda eslatib o'tiladigan plato bor. Albatta, har yili besh yil davomida bir turdagi pyuresni teng miqdordagi so'zlar yo'q edi? Nima bo'lganda ham, o'sha davrda nashr etilgan ko'plab kitoblar yo'qligi va bizning ma'lumotlarimiz silliq bo'lganligi sababli rasmni buzadi. Ehtimol, sirka pyureini qayd etgan bitta kitob bor edi va u erda oddiygina boshoqdan qochish uchun o'rtacha hisoblangan. Yumshatishni 0 ga sozlab, biz aynan shunday vaziyatni ko'rishimiz mumkin. 1869-yilda ochilgan shox o'simliklar va 1897 va 1900 yillarda yana bir uchqun bor.

Hech kim vaqtni sirka haqida gapirmaganmi? Ehtimol, bu pies haqida gapirishgan. Ehtimol, hamma joylarda suzuvchi retseptlar bor edi. Ular faqat kitoblarda ular haqida yozmaganlar, va bu Ngram-ning izlanishlari cheklangan.

Murakkab Ngram izlaydi

Ngramsning turli xil matn terishmalaridan iborat bo'lishi mumkinligini aytganimizni eslay olasizmi? Google shuningdek, Ngram Viewer bilan ham bir oz pastga o'tishi mumkin. Agar siz baliqni ism so'zi o'rniga baliqni izlashni istasangiz, bu teglarni ishlatishingiz mumkin. Bunday holda siz "fish_VERB" ni qidirasiz

Google o'z veb-saytida foydalanishingiz mumkin bo'lgan buyruqlarning to'liq ro'yxati va boshqa rivojlangan hujjatlarni taqdim etadi.