Үлкен деректерді кім жинайды және не үшін?

2019 жылдың күзінде Apple Card қызметіне қатысты жанжал туындады: тіркелу кезінде ол ерлер мен әйелдерге әртүрлі несие лимиттерін шығарды. Тіпті Стив Возняктың жолы болмады:

Бір жыл бұрын Netflix платформасы пайдаланушыларға жынысына, жасына және ұлтына байланысты әртүрлі плакаттар мен тизерлерді көрсететіні анықталды. Бұл үшін қызмет нәсілшілдікпен айыпталды.

Соңында, Марк Цукербергке Facebook өз пайдаланушыларының деректерін жинады, сатты және манипуляциялады деген айыппен үнемі сөгіс алады. Көптеген жылдар бойы ол американдық сайлау кезінде айла-шарғы жасады, ресейлік арнайы қызметтерге көмектесті, өшпенділік пен радикалды көзқарастарды қоздырды, орынсыз жарнама жасады, пайдаланушы деректерін жариялады, педофилдерге қарсы тергеуге кедергі жасады деп айыпталып, тіпті сотталды.

Зуктың Facebook жазбасы

Бұл ретте Pornhub онлайн сервисі жыл сайын жынысы мен жасы әртүрлі ұлт өкілдерінің қандай порнографты іздейтіні туралы есептерді жариялайды. Және бұл қандай да бір себептермен ешкімді алаңдатпайды. Бұл оқиғалардың барлығы ұқсас болғанымен: олардың әрқайсысында біз XNUMX ғасырда «жаңа мұнай» деп аталатын үлкен деректермен айналысамыз.

Үлкен деректер дегеніміз не

Үлкен деректер – олар да үлкен деректер (ағыл. Big Data) немесе метадеректер – жүйелі түрде және үлкен көлемде келетін деректер жиыны. Олар жиналады, өңделеді және талданады, нәтижесінде нақты үлгілер мен үлгілер алынады.

Жарқын мысал - үздіксіз және көп мөлшерде келетін Үлкен адрон коллайдерінен алынған деректер. Олардың көмегімен ғалымдар көптеген мәселелерді шешеді.

Бірақ ғаламтордағы үлкен деректер ғылыми зерттеулерге арналған статистика ғана емес. Оларды әртүрлі топтар мен ұлттардағы пайдаланушылардың өзін қалай ұстайтынын, не нәрсеге назар аударатынын және мазмұнмен қалай әрекеттесетінін бақылау үшін пайдалануға болады. Кейде бұл үшін деректер бір көзден емес, бірнеше жерден белгілі бір заңдылықтарды салыстыру және анықтау арқылы жиналады.

Желіде үлкен деректердің қаншалықты маңызды екендігі туралы олар шынымен көп болған кезде сөйлесе бастады. 2020 жылдың басында әлемде 4,5 миллиард интернет пайдаланушы болса, оның 3,8 миллиарды әлеуметтік желілерде тіркелген.

Үлкен деректерге кім қол жеткізе алады

Сауалнамаларға сәйкес, біздің елдеріміздің жартысынан көбі желідегі деректерін үшінші тұлғалар пайдаланады деп есептейді. Бұл ретте көбі әлеуметтік желілер мен қосымшаларға жеке мәліметтерін, фотоларын, тіпті телефон нөмірін жариялайды.

Үлкен деректерді кім жинайды және не үшін?
Үлкен деректерді кім жинайды және не үшін?
Үлкен деректерді кім жинайды және не үшін?
Үлкен деректерді кім жинайды және не үшін?

Оны мына жерде түсіндіру керек: бірінші адам – пайдаланушының өзі, ол өз деректерін кез келген ресурсқа немесе қолданбаға орналастырады. Сонымен бірге ол осы деректерді өңдеуге келіседі (келісімге белгі қояды). екінші тарап – яғни ресурс иелері. Үшінші тарап – ресурс иелері пайдаланушы деректерін тасымалдай немесе сата алатын тұлғалар. Көбінесе бұл пайдаланушы келісімінде жазылады, бірақ әрқашан емес.

Үшінші тарап – коммерциялық мақсатта деректерді сатып алатын мемлекеттік органдар, хакерлер немесе компаниялар. Біріншісі деректерді соттың немесе жоғары тұрған органның шешімімен ала алады. Хакерлер, әрине, ешқандай рұқсаттарды пайдаланбайды – олар жай ғана серверлерде сақталған дерекқорларды бұзады. Компаниялар (заң бойынша) деректерге сіз өзіңіз рұқсат берген жағдайда ғана қол жеткізе алады – келісім бойынша құсбелгі қою арқылы. Әйтпесе, бұл заңсыз.

Неліктен компаниялар үлкен деректерді пайдаланады?

Коммерциялық саладағы үлкен деректер ондаған жылдар бойы қолданылып келеді, ол қазіргідей қарқынды емес еді. Бұл, мысалы, бақылау камераларының жазбалары, GPS навигаторларының деректері немесе онлайн төлемдер. Енді әлеуметтік желілерді, онлайн қызметтерді және қосымшаларды дамыта отырып, мұның барлығын қосуға және ең толық суретті алуға болады: әлеуетті тұтынушылар қайда тұрады, олар нені көргенді ұнатады, демалысқа қайда барады және қандай маркалы автокөлік бар.

Жоғарыда келтірілген мысалдардан үлкен деректердің көмегімен компаниялар, ең алдымен, жарнамаларды мақсатты түрде көрсеткісі келетіні анық. Яғни, өнімдерді, қызметтерді немесе жеке опцияларды тек дұрыс аудиторияға ұсыну және тіпті белгілі бір пайдаланушы үшін өнімді теңшеу. Сонымен қатар, Facebook және басқа да үлкен платформаларда жарнама барған сайын қымбаттап барады және оны барлығына қатарынан көрсету мүлдем тиімді емес.

Ашық көздерден әлеуетті клиенттер туралы ақпаратты сақтандыру компаниялары, жеке клиникалар және жұмыс берушілер белсенді пайдаланады. Біріншісі, мысалы, белгілі бір аурулар немесе дәрі-дәрмектер туралы ақпаратты жиі іздейтініңізді көрсе, сақтандыру шарттарын өзгерте алады, ал жұмыс берушілер сіздің жанжалдарға және қоғамға қарсы мінез-құлыққа бейімділігіңізді бағалай алады.

Бірақ соңғы жылдары күресіп жатқан тағы бір маңызды міндет бар: ең төлем қабілетті аудиторияға жақындау. Мұны істеу оңай емес, дегенмен тапсырманы төлем қызметтері және бір OFD (фискалдық деректер операторы) арқылы электрондық чектер айтарлықтай жеңілдетеді. Мүмкіндігінше жақын болу үшін компаниялар әлеуетті тұтынушыларды бала кезінен қадағалап, «тәрбиелеуге» тырысады.: онлайн ойындар, интерактивті ойыншықтар және білім беру қызметтері арқылы.

Бұл қалай жұмыс істейді?

Деректерді жинаудың ең үлкен мүмкіндіктері бір уақытта бірнеше қызметтерге ие жаһандық корпорациялар болып табылады. Қазір Facebook-тің 2,5 миллиардтан астам белсенді пайдаланушылары бар. Сонымен қатар, компанияның басқа қызметтері де бар: Instagram – 1 миллиардтан астам, WhatsApp – 2 миллиардтан астам және т.б.

Бірақ Google одан да көп әсер етеді: Gmail-ді әлемде 1,5 миллиард адам, тағы 2,5 миллиардын Android ұялы ОЖ, 2 миллиардтан астамы YouTube пайдаланады. Бұл Google іздеуі мен Google Maps қолданбаларын, Google Play дүкенін және Chrome браузерін есептемейді. Бұл сіздің онлайн банкіңізді бекіту үшін қалады - және Google сіз туралы бәрін біле алады. Айтпақшы, Яндекс бұл мәселеде қазірдің өзінде бір қадам алда, бірақ ол тек орыстілді аудиторияны қамтиды.



???? Біріншіден, компанияларды әлеуметтік желілерде не жариялап, нені ұнататынымыз қызықтырады. Мысалы, егер банк сіздің үйленгеніңізді және Instagram немесе Tinder-те қыздарды белсенді түрде ұнататыныңызды көрсе, сіз тұтынушылық несиені мақұлдайтын боласыз. Ал отбасының ипотекасы жойылды.

Сондай-ақ қандай жарнамаларды басатыныңыз, қаншалықты жиі және қандай нәтиже беретіні маңызды.

(Яғни Келесі қадам - ​​жеке хабарламалар: оларда әлдеқайда көп ақпарат бар. Хабарламалар ВКонтакте, Facebook, WhatsApp және басқа да мессенджерлерде тараған. Олардың айтуынша, айтпақшы, хабарлама жіберілген кезде геолокацияны қадағалау оңай. Сіз байқадыңыз: біреумен бірдеңе сатып алу немесе жай ғана пиццаға тапсырыс беру туралы сөйлескенде, арнада бірден тиісті жарнама пайда болады.

🚕 Үлкен деректер жеткізу және такси қызметтері арқылы белсенді түрде пайдаланылады және «ағызылады». Олар сіздің қайда тұратыныңызды және жұмыс істейтініңізді, нені жақсы көретініңізді, шамамен табысыңыз қандай екенін біледі. Мысалы, Uber, егер сіз үйге бардан айдап бара жатқан болсаңыз және шамадан тыс асып кетсеңіз, бағаны жоғарырақ көрсетеді. Ал сіздің телефоныңызда басқа агрегаторлар тобы болған кезде, керісінше, олар арзанырақтарын ұсынады.

(Яғни Мүмкіндігінше көбірек ақпарат жинау үшін фотосуреттер мен бейнелерді пайдаланатын қызметтер бар. Мысалы, компьютерлік көру кітапханалары – Google-да біреуі бар. Олар сізді және айналаңызды сканерлейді, сіздің өлшеміңіз немесе бойыңыз, қандай бренд киетініңізді, қандай көлік жүргізетініңізді, балаларыңыз бен үй жануарларыңыз бар-жоғын білу үшін.

(Яғни Банктерге пошталық жөнелтілімдер үшін SMS шлюзін беретіндер картадағы сатып алуларыңызды бақылай алады – соңғы 4 сан мен телефон нөмірін білу – содан кейін бұл деректерді басқа біреуге сату. Сондықтан жеңілдіктер мен сыйлық ретінде пицца бар осы спамның барлығы.

🤷️️ Ақырында, біз өз деректерімізді сол жақ қызметтер мен қолданбаларға жібереміз. Есіңізде болсын, Getcontact-тың айналасындағы шулы шу, ол кезде басқалар оны қалай жазғанын білу үшін әркім өз телефон нөмірін толтыруға қуанышты болды. Енді олардың келісімін тауып, деректеріңізді беру туралы не айтылғанын оқыңыз (спойлер: иелері оларды өз қалауы бойынша үшінші тұлғаларға бере алады):

Үлкен деректерді кім жинайды және не үшін?

Корпорациялар сол Facebook-те болғандай, сотқа дейін, жылдар бойы пайдаланушы деректерін сәтті жинап, тіпті сата алады. Содан кейін шешуші рөлді компанияның GDPR бұзуы ойнады - ЕО заңы деректерді пайдалануды американдықпен салыстырғанда әлдеқайда қатаң шектейді. Тағы бір соңғы мысал - Avast антивирустық жанжал: компанияның еншілес қызметтерінің бірі 100-ден 400 миллионға дейінгі пайдаланушылардың деректерін жинап, сатты.

Бірақ мұның бәрінің бізге пайдасы бар ма?

Үлкен деректер бәрімізге қалай көмектеседі?

Иә, жақсы жағы да бар.

Үлкен деректер қылмыскерлерді ұстауға және лаңкестік әрекеттердің алдын алуға, жоғалған балаларды табуға және оларды қауіптен қорғауға көмектеседі.

Олардың көмегімен біз біз банктерден керемет ұсыныстар мен жеке жеңілдіктер аламыз. Солардың арқасында біз біз тек жарнамадан табыс табатын көптеген қызметтер мен әлеуметтік желілер үшін төлемейміз. Әйтпесе, Инстаграмның өзі бізге айына бірнеше мың долларға түсер еді.

Бір ғана Facebook-тің 2,4 миллиард белсенді пайдаланушысы бар. Бұл ретте олардың 2019 жылғы табысы 18,5 млрд долларды құрады. Компания жарнама арқылы әр қолданушыдан жылына 7,7 долларға дейін табыс табады екен.

Ақырында, кейде бұл жай ғана ыңғайлы: қызметтер сіздің қайда екеніңізді және не қалайтыныңызды білетін кезде және сізге қажет ақпаратты өзіңіз іздеудің қажеті жоқ.

Үлкен деректерді қолданудың тағы бір перспективті бағыты – білім беру.

Вирджиниядағы американдық университеттердің бірінде тәуекел тобы деп аталатын студенттер туралы деректер жинау үшін зерттеу жүргізілді. Бұл нашар оқитындар, сабақтан қалып, оқуды тастағалы жатқандар. Өйткені, штаттарда жыл сайын 400-ге жуық адам шегеріледі. Бұл рейтингтері төмендеп, қаржыландыруы қысқарған университеттер үшін де, студенттердің өздері үшін де жаман: көбісі оқуға несие алады, ал несиені шегергеннен кейін де қайтаруға тура келеді. Жоғалған уақыт пен мансап перспективаларын айтпағанның өзінде. Үлкен деректердің көмегімен уақыт бойынша артта қалғандарды анықтап, оларға репетитор, қосымша сабақтар және басқа да атаулы көмек көрсетуге болады.

Айтпақшы, бұл мектептер үшін де қолайлы: содан кейін жүйе мұғалімдер мен ата-аналарға хабарлайды - олар баланың проблемалары бар, оған бірге көмектесейік дейді. Үлкен деректер сонымен қатар қай оқулықтар жақсы жұмыс істейтінін және қай мұғалімдер материалды оңай түсіндіретінін түсінуге көмектеседі.

Тағы бір оң мысал мансаптық профильдеу.: бұл кезде жасөспірімдерге болашақ мамандығын таңдауға көмектеседі. Мұнда үлкен деректер дәстүрлі тесттер арқылы алынбайтын ақпаратты жинауға мүмкіндік береді: пайдаланушы өзін қалай ұстайды, ол неге назар аударады, мазмұнмен қалай әрекеттеседі.

Сол АҚШ-та кәсіптік бағдар беру бағдарламасы бар – SC ACCELERATE. Ол басқа нәрселермен қатар CareerChoice GPS технологиясын пайдаланады: олар студенттердің табиғаты, олардың пәндерге бейімділігі, күшті және әлсіз жақтары туралы деректерді талдайды. Содан кейін деректер жасөспірімдерге өздері үшін дұрыс колледждерді таңдауға көмектесу үшін пайдаланылады.


Яндекс.Zen сайтына жазылыңыз және бізге жазылыңыз — технология, инновация, экономика, білім және бір арнада бөлісу.

пікір қалдыру