Vraag aan de expert: klopt het dat sociale netwerken ons in de gaten houden?
Dmitry Kurkin
REACTIE OP DE MEERDERHEID VAN ONS VRAGEN we gebruikten om online te zoeken. In de nieuwe reeks materialen stellen we dergelijke vragen: brandend, onverwacht of wijdverspreid - aan professionals op verschillende gebieden.
De flashmobiel van 10 jaar uitdaging, gelanceerd in sociale netwerken aan het begin van het jaar, leidde niet alleen tot samenzweringstheorieën dat het doel van de campagne was om foto's van gebruikers te verzamelen en hen te trainen in het herkennen van gezichtsherkenningssystemen, maar ook hen opnieuw te laten nadenken over hoeveel ze van ons weten. sociale netwerken en derde partijen die met hen samenwerken (van commerciële bedrijven tot overheidsinstellingen).
Het feit dat technologische giganten de zogenaamde digitale footprints verzamelen en analyseren die door miljarden gebruikers dagelijks zijn achtergelaten, is voor niemand geheim. En het besef hiervan leidt tot een nieuw soort angst voor de "grote broer": sociale netwerken weten veel over ons, maar wat als ze teveel van ons weten? Kunnen big data worden gebruikt om alle connecties, smaken, gewoonten van een persoon, zijn verleden en heden te achterhalen? En zo ja, welke schade kan ons verlangen om online te socialiseren, waarbij we vrijwillig informatie over onszelf delen, veroorzaken?
We vroegen experts hoe gebruikersgegevens worden verwerkt door grote bedrijven en hoe groot het gevaar is om te erven op sociale netwerken.
Liliya Zemnukhova
Onderzoeker bij het Centrum voor Wetenschaps- en Technologieonderzoek aan de Europese Universiteit van St. Petersburg
Een digitale footprint bevat alle mogelijke soorten gegevens: teksten, afbeeldingen, audio- en video-opnamen, geolocatie en veel metadata (bijvoorbeeld gadgetmodel, mobiele operator, besturingssysteem, dynamiek en duur van bezoeken, enz.). En het zijn niet alleen wij die onze digitale voetafdruk aanvullen. Sociale netwerken vormen ons als gebruikers met behulp van drie gegevensbronnen: het feit dat we zelf over onszelf rapporteren; dat anderen over ons rapporteren; en wat gaat meestal zonder onze kennis. Vooral ondoorzichtig als laatste. We lezen in de regel geen gebruikersovereenkomsten en beleid voor het verzamelen en gebruiken van persoonlijke gegevens. We merken alleen op dat deze "zwarte doos" op de een of andere manier invloed heeft op onze gebruikerservaring: gerichte advertenties, suggesties van vrienden, aanbevelingen voor muziek, de procedure voor het lanceren van nieuws ... We construeren een klein deel van deze ervaring zelf, wanneer we de nieuwsfeed handmatig bouwen, maar voornamelijk algoritmen voer de functies uit die zijn ingesloten in de standaardprofielen. Daarom raken we nooit van contextuele advertenties of indringende suggesties van groepen of (niet) vrienden af. Sociale netwerken omdat bedrijven gegevens over hun gebruikers gebruiken voor commerciële doeleinden en hun platform aanbieden voor de verkoop van gerichte inhoud. En onderweg blijven ze gegevens over ons verzamelen: als u bijvoorbeeld ten minste één keer voor advertenties hebt betaald, blijven de bankkaart- en transactiegegevens ook bij het bedrijf. Gegevens kunnen ook aan overheidsinstanties worden verstrekt wanneer er een grote behoefte aan is: Facebook werkt bijvoorbeeld regelmatig samen met Amerikaanse overheidsinstanties, in overeenstemming met zijn transparantiebeleid.
Naast het interne beleid van sociale netwerken is er nog een belangrijk detail: accounts kunnen worden geassocieerd met honderdduizenden andere applicaties en functies. Dit was bijvoorbeeld de reden voor grote discussies vorig jaar over de toegang van derden tot gebruikersgegevens. In de Europese Unie is een belangrijke poging gedaan om de vrijheid van ontwikkelaars te reguleren. Vorig jaar is de Algemene Verordening Gegevensbescherming (GDPR) in werking getreden. Hij besloot geen gegevensproblemen over te dragen, maar vestigde de aandacht van gebruikers op deze vraag. Dit verplicht ons niet om alle gebruikersovereenkomsten te lezen, maar het doet ons denken en op zijn minst meer verantwoordelijk zijn voor onze digitale voetafdrukken en de elementaire regels van digitale hygiëne volgen.
Valeria Karavaeva
data scientist bij Spiking
We denken soms niet na over hoeveel nummers we op internet achterlaten en hoe veel later bedrijven worden geholpen, niet alleen sociale netwerken, maar ook sociale netwerken. Sociale netwerken verzamelen niet alleen gegevens voor zichzelf, ze kunnen ze verkopen - ik weet het, omdat ik bij een reclamebureau werkte en we kochten gegevens van Facebook. En meestal geven wij, de gebruikers, hier toestemming zonder het op te merken. Mensen brengen de helft van hun leven door op sociale netwerken en geven veel informatie over zichzelf.
Maar het was mogelijk om eerder gegevens te verzamelen - dus waarom bent u pas kort geleden over big data gaan praten? Allereerst omdat de rekenkracht groeit en dus goedkoper wordt. Het belangrijkste probleem van big data is niet hoe gegevens moeten worden verzameld - in principe kan ieder van ons vandaag terabytes aan informatie verzamelen en opslaan - maar hoe ermee te werken. De meeste gegevens die worden verkregen via sociale netwerken (tekst, spraak, afbeeldingen, video) zijn op geen enkele manier gestructureerd, dus zonder machine learning is big data nutteloos. Nu kracht en geheugen goedkoper zijn geworden, is de vraag naar neurale netwerken en diepgaand leren toegenomen - we hebben eindelijk geleerd om grote gegevensreeksen te verwerken.
Neem bijvoorbeeld foto's - en dit zijn echt big data, ze kunnen veel informatie geven. Er zijn miljoenen foto's, maar wat te doen met hen? Welke voordelen kunnen eruit worden getrokken? Welke patronen laten ze je weten? Machine learning is in feite niet zo ver weg. Dit is niet zo'n eenvoudig proces als het lijkt: er is niet zoiets dat je op een knop drukt en in een week volledige berekeningen ontvangt.
Rechtstreeks machine learning wordt voorafgegaan door meer complexe taken. Dezelfde foto's moeten eerst goed worden verwerkt (bijvoorbeeld bijgesneden, gecentreerde foto's, dit is belangrijk om te leren) - dit is de eerste fase, die meestal lang duurt. De tweede fase is om een netwerkarchitectuur te kiezen die geschikt is om het probleem op te lossen. Grof gezegd, je bouwt tien verschillende neurale netwerken, en ze geven tien verschillende resultaten. Dan moet je op de een of andere manier de resultaten evalueren. En daarna keer je met grote waarschijnlijkheid terug naar de eerste fase. Het is onmogelijk om voor elke taak één universeel netwerk te bouwen: u bouwt het volledig op of u wijzigt een bestaand netwerk. Gezichtsherkenning is één taak, de herkenning van katten is een andere.
In het proces van machine learning doen we ook mee, zonder het te weten. Bijvoorbeeld, het introduceren van captcha op sites: het gebruik van captcha, door Google getrainde neurale netwerken om boeken te digitaliseren.
We moeten begrijpen dat bedrijven die big data verzamelen niet geïnteresseerd zijn in onze persoonlijke profielen. Ze hebben gegevens nodig over veel verschillende mensen die geïnteresseerd zijn in iets specifieks. Wat de speciale diensten betreft, ik denk dat ze gegevens kunnen verzamelen zonder gebruik te maken van sociale netwerken. Ik denk dat onze angst dat we in de gaten worden gehouden binnenkort voorbij zal gaan. Dit is de nieuwe wereld: het is mogelijk om het web niet te traceren, maar het is moeilijk. Het is gemakkelijker om helemaal niet op het web te verschijnen.
FOTO'S: antonsov85 - stock.adobe.com