"Katta ma'lumot" nima?

Va nima uchun bu katta ishmi?

"Katta ma'lumot" - katta hajmdagi tuzilmalar ma'lumotlarini o'rganish orqali odamlarning xulq-atvorini tushunish va bashorat qilishning yangi ilmidir. Katta ma'lumotlar "taxminiy tahlil" deb nomlanadi.

Twitterdagi yozuvlarni tahlil qilish, Facebook tasmalari, eBay qidiruvlari, GPS izdoshlari va ATM mashinalari ayrim katta ma'lumotlar misollari. Xavfsizlik videolarini, trafik ma'lumotlarini, ob-havo ma'lumotlarini, parvozlarni kelayotganlarni, uyali telefon minoralari jurnallarini va yurak urish o'lchovlarini o'rganish boshqa usullardir. Katta ma'lumot - bu haftalik o'zgarishlarni o'zgartiradigan, yangi bilimdir va faqat bir nechta mutaxassis bularni tushunadi.

Muntazam hayotda katta ma'lumotlarning ayrim misollar qanday?

screenshot http://project.wnyc.org/transit-time

Ko'pgina katta ma'lumotlar loyihalari juda qorong'i bo'lsa-da, odamlar, kompaniyalar va hukumatlarning kundalik hayotiga ta'sir ko'rsatadigan katta ma'lumotlarning muvaffaqiyatli namunalari mavjud:

Virus epidemiyalarini bashorat qilish: ijtimoiy-siyosiy ma'lumotlar, ob-havo va iqlim ma'lumotlari va shifoxona ma'lumotlarini o'rganish orqali bu olimlar 4 haftalik oldindan ogohlantiruvchi dag'al isitma epidemiyasini taxmin qilmoqdalar.

Homicide Watch: bu katta ma'lumot loyihasi profsoyuz Vashingtondagi qotillik qurbonlari, gumondorlari va jinoyatchilar profilini tashkil qiladi. Ham, marhumni hurmat qilish va odamlar uchun xabardorlik manbai sifatida, bu katta ma'lumot loyihasi ajoyibdir.

Tranzitni Sayohat Rejalashtirish, NYC: WNYC radio dasturchisi Stiv Melendez onlayn metro rejasini sayohat sayohati dasturi bilan birlashtirdi. Uning yaratilishi Nyu-Yorkchilar xaritada o'z manzillarini bosish imkonini beradi va poezdlar va metro uchun sayohat vaqtini taxmin qilish mumkin.

Xerox ish kuchini yo'qotdi: chaqiriq markazi ishi hissiy jihatdan toliqdi. Xerox professional tahlilchilar yordamida ma'lumotlarni to'plamini o'rganib chiqdi va hozirda ular qaysi chaqiriq markazi ishlayotganini kompaniyaga eng uzoq muddat qolishi mumkinligini taxmin qilishlari mumkin.

Terrorizmga qarshi kurashni qo'llab-quvvatlash: Ijtimoiy axborot vositalarini, moliyaviy hisobotlarni, parvozlar buyurtmalarini va xavfsizlik ma'lumotlarini o'rganish orqali huquqni muhofaza qilish organlari terroristik gumondorlarni yovuz ishlarini qilmasdan oldindan aniqlashi va topishi mumkin.

Tovarlarni marketingni ijtimoiy media sharhlar asosida tuzish : odamlar ochiq-oydin va tezda pub, restoran yoki fitness klubida onlayn fikrlarini baham ko'rishadi. Ushbu millionlab ijtimoiy media lavozimlarini o'rganish va kompaniyaga o'zlarining xizmatlariga nisbatan qanday fikrda ekanligi haqida ma'lumot berish mumkin.

Katta ma'lumotni kim ishlatadi? Ular nima qilishadi?

Ko'p monolitik korporatsiyalar mijozlar ehtiyojini qondirish maksadini oshirish uchun o'z taklif va narxlarini o'zgartirish uchun katta ma'lumotlarni ishlatadilar.

Nima uchun Big Data bunday katta bitimmi?

4 ta katta ma'lumotlar katta ahamiyatga ega:

1. Ma'lumotlar katta. U bir qattiq diskda , USB xotirasida kamroq mos kelmaydi. Ma'lumotlarning miqdori inson aqliga qanchalik ta'sir qilishi mumkinligini (milliard milliard megabaytni o'ylab, undan keyin milliardlab dollar ko'payishi mumkin) oshib ketadi.

2. Ma'lumotlar tarqoq va tuzilmaga ega emas. Katta hajmdagi ma'lumotlarning 50% dan 80% gacha bo'lgan ma'lumotni o'zgartiradi va tozalanadi, natijada qidirish mumkin va tartibga solinadi. Sayyoramizdagi bir necha ming nafar mutaxassis bu ma'lumotni qanday qilib tozalashni biladi. Ushbu mutaxassislar, shuningdek, HPE va Hadoop kabi juda ko'p maxsus uskunalarga ega bo'lishlari kerak. Ehtimol, 10 yil ichida katta ma'lumotlar mutaxassislari o'nlab kishiga aylanadi, ammo hozirgi vaqtda ular juda kam uchraydigan tahlilchi va ularning ishi hali juda qorong'i va zerikarli.

3. Ma'lumot sotilgan va sotib olinadigan tovarga aylangan. Kompaniyalar va shaxslar ijtimoiy media va boshqa ma'lumotlarni terabayt sotib olishlari mumkin bo'lgan ma'lumotlar bozorlari mavjud. Ma'lumotlarning aksariyati bulutga asoslangan bo'lib, u har qanday bitta qattiq diskka joylashish uchun juda katta. Ma'lumotlarni xarid qilish, odatda, bulutli serverlar fermasiga ulangan abonent to'lovini o'z ichiga oladi.

Katta ma'lumot vositalari va g'oyalar Amazon, Google, Facebook va Yahoo. Ushbu kompaniyalar onlayn xizmatlar bilan millionlab kishilarga xizmat qilganligi sababli ular katta ma'lumotlar tahlillari ortida yig'ish nuqtasi va tuyuluvchi bo'lar edi.

4. Katta ma'lumotlarning imkoniyatlari cheksizdir. Ehtimol, shifokorlar bir kunda bir necha hafta oldin yurak xurujlari va qon tomirlarini taxmin qilishadi. Parvoz va avtoulovlar mexanik ma'lumot va transport va ob-havo naqshlarining taxminiy tahlili bilan kamayishi mumkin. Onlayn dating sizning kimgadir mos keluvchi shaxslarning katta ma'lumotlarini oldindan aniqlaydiganlarga ega bo'lishi mumkin. Musiqiy tinglovchilar musiqa kompozitsiyasi maqsadli auditoriyalarning o'zgaruvchan ta'mi uchun eng yoqimlidir. Oziqlantirishchilar do'kondan sotib olingan oziq-ovqat mahsulotlarining qaysi kombinatsiyasini yanada kuchaytirishi yoki insonning tibbiy holatiga yordam berishini taxmin qilishlari mumkin. Sirt faqat chizilgan va katta ma'lumotlarda kashfiyotlar har hafta sodir bo'ladi.

Katta ma'lumotlar noto'g'ri

Monty Rakusen / Getty

Katta hajmdagi ma'lumotlar bashoratli analitikdir: massiv bo'lmagan tuzilmaviy ma'lumotni izlash va ko'rib chiqiladigan narsaga aylantirish. Bu alohida bilim va sabr-toqat talab qiladigan murakkab va xaotik makondir.

Misol uchun, monolitik UPS yetkazib berish xizmatini olaylik. UPS dasturchilari o'zlarining haydovchilarining GPS va smartfonlaridan ma'lumotlarni yo'l harakati to'siqlariga moslashtirish uchun eng samarali usullarini tahlil qilish bo'yicha ma'lumotlarni o'rganadilar. Ushbu GPS va smartfon ma'lumotlari juda chiroyli va tahlilga tayyor emas. Ushbu ma'lumotlar har xil GPS va xarita ma'lumotlar bazalaridan, turli xil smartfon apparat qurilmalari orqali to'kiladi. UPS tahlilchilar oylar davomida barcha ma'lumotlarni osongina qidirish va tartiblash mumkin bo'lgan formatga aylantirdi. Biroq, bunga arziydi. Bugungi kunda UPS bu katta ma'lumotlardan foydalanishni boshlagach, 8 milliondan ortiq galon yoqilg'ini qutqardi.

Katta ma'lumot tarqab ketganligi sababli, axborotni tozalash va ulardan foydalanishga tayyorlash uchun juda ko'p harakat talab etiladi, ma'lumot olimlari o'zlari bajaradigan barcha zerikarli ish uchun "ma'lumotni yig'ishtiruvchi" deb nomlanadilar. مور

Katta ma'lumot va ilg'or tahlil fani har haftada yaxshilanmoqda. Katta ma'lumotni 2025 yilga kelib har kimga osonlik bilan kirish uchun kutish kerak.

Big Data shaxsiy ma'lumot uchun daxlsiz tahdid emasmi?

Feingersh / Getty

Ha, bizning qonunlarimiz va shaxsiy shaxsiy himoyachilarimiz diqqat bilan boshqarilmasa, katta ma'lumotlar shaxsiy maxfiylikka o'tib ketadi. Shuni aytish joizki, Google, YouTube va Facebook sizning kundalik onlayn odatlaringizni kuzatib bormoqda . Sizning smartfoningiz va kompyuteringiz hayoti raqamli oyoq izlarini har kuni qoldiradi va murakkab kompaniyalar ushbu izlarni o'rganmoqda.

Katta ma'lumot atrofidagi qonunlar rivojlanmoqda. Maxfiylik hozir sizning shaxsiy javobgarligingizni qabul qilishingiz kerak, chunki siz endi uni odatiy huquq deb hisoblamasligingiz mumkin.

Maxfiyligingizni himoya qilish uchun nima qilishingiz mumkin:

Qabul qilishingiz mumkin bo'lgan eng katta qadam VPN tarmoq ulanishini ishlatib, kundalik odatlaringizni yashirishdir . VPN xizmati sizning identifikatoringiz va joylashuvingizni hech bo'lmaganda qisman izdoshlar tomonidan maskalanishi uchun signalingizni uyg'otadi. Bu sizni 100% anonim deb bo'lmaydi, biroq VPN sizning dunyodagi onlayn odatlaringizni qanday kuzatishi mumkinligini sezilarli darajada kamaytiradi.

Big Data haqida ko'proq qaerdan bilish mumkin?

Monty Raskusen / Getty

Katta ma'lumot analitik aqli va texnologiyaga bo'lgan sevgisi uchun ajoyib narsa. Agar bu sizniki bo'lsa, qiziqarli katta ma'lumot loyihalarining ushbu sahifasiga albatta tashrif buyuring.