Web-eskalako edukien azterketa: lineako edukiei zentzua ematea

IRUDIAREN KREDITUA:
Irudiaren kreditu
iStock

Web-eskalako edukien azterketa: lineako edukiei zentzua ematea

Web-eskalako edukien azterketa: lineako edukiei zentzua ematea

Azpitituluaren testua
Web-eskalako edukien azterketak Interneten dagoen informazio-bolumenak eskaneatzen eta kontrolatzen lagun dezake, gorroto-hizkera identifikatzen barne.
    • Egilea:
    • Egilearen izena
      Quantumrun Prospektiba
    • Azaroaren 7, 2023

    Ikuspegiaren laburpena

    Machine learning eta AI sareko eduki ugari aztertzeko modua iraultzen ari dira. Web-eskalako edukien analisia, ohiko edukien analisiaren forma zabalagoa, hizkuntza naturalaren prozesamendua (NLP) eta sare sozialen analisia (SNA) bezalako teknikak erabiltzen ditu Interneteko datuak sailkatu eta ulertzeko. Horrek gorrotozko hizkera bezalako eduki kaltegarriak markatzen laguntzen ez ezik, finantza-delituen inguruko informazio baliotsua ere ematen du, azterketa-denbora nabarmen murrizten du. Hala ere, teknologiak deepfake eduki eta propaganda zabaltzearen inguruko kezkak ere sortzen ditu. Eboluzionatzen doan heinean, ondorio zabalagoak ditu, besteak beste, hizkuntza-itzulpen hobetua, alborapenen detekzioa eta zibersegurtasun neurri hobeak.

    Web-eskala edukien analisiaren testuingurua

    Web-eskalako eduki-analisia eduki-analisiaren bertsio handiago bat da. Prozesu honek hizkuntza-elementuak aztertzen ditu, batez ere egitura-ezaugarriak (adibidez, mezuaren luzera, testu- edo irudi-osagai jakin batzuen banaketa) eta komunikazioetako gai semantikoak edo esanahiak aztertzea. Helburua da AI informazioa hobeto sailkatzen eta hari balioa ematen lagun diezaioketen ereduak eta joerak agertzea. Web-eskalako edukien analisiak AI/ML erabiltzen du prozesua automatizatzeko hizkuntza naturalaren prozesamenduaren (NLP) eta sare sozialen analisiaren (SNA) bidez. 

    NLP webguneetako testua ulertzeko erabiltzen da, eta SNA, berriz, gune horien arteko harremanak zehazteko erabiltzen da batez ere hiperesteken bidez. Metodo hauek sare sozialetan gorrotozko diskurtsoa identifikatzen eta kalitate akademikoa eta komunitatearen eraketa aztertzen lagun dezakete sareko argitalpenen, iruzkinen eta interakzioen bidez. Bereziki, NLP-k testua banaka hitzetan zati dezake eta, ondoren, horren arabera aztertu. Horrez gain, algoritmo honek gako-hitz edo esaldi zehatzak identifikatu ditzake webgune baten edukiaren barruan. AIk ere zehaztu dezake hitz batzuk zenbat maiz erabiltzen diren eta testuinguru positibo edo negatibo batean erabiltzen diren.

    Eragin disruptiboa

    Zenbait jakintsuren ustez, web-edukia esponentzialki handitzen ari denez eta antolatu eta kontrolatu gabeago bihurtzen ari denez, algoritmoek informazio hori guztia indexatu eta zentzua emateko metodo estandarizatu bat egon behar da. Kodetze bidezko edukien analisi automatizatuak hamarkada batzuk daramatzaten arren, gehienbat protokolo zaharkitua jarraitzen dute: hitz-maiztasunak zenbatzea eta testu-fitxategiak prozesatzea besterik ez. Ikaskuntza sakonak eta NLP-k askoz gehiago egin dezakete AI entrenatuz mezuen atzean dagoen testuingurua eta motiboa ulertzeko. Izan ere, PNL hain ona lortu da hitzen analisian eta kategorizazioan, non gizakiek hitzak eta esaldiak nola antolatzen dituzten imita dezaketen idazketa laguntzaile birtualak sortu baititu. Zoritxarrez, aurrerapen bera erabiltzen ari da propaganda eta desinformazioa sustatzeko diseinatutako artikuluak eta mezuak bezalako eduki faltsuak idazteko.

    Hala ere, web-eskalako edukien analisia ona da gorrotoa eta hizkera bortitza markatzeko eta sare sozialetako eragile txarrak identifikatzen. Sare sozialetako plataforma guztiek legez kanpoko jarduerak edo ziberjazarpena sustatzen dituztenak identifikatu ditzaketen edukiak berrikusteko sistema batean oinarritzen dira. Edukiak moderatzeaz gain, web-eskalako analisiak prestakuntza-datuak sor ditzake algoritmoei finantza-delituak identifikatzen laguntzeko, hala nola, dirua zuritzea, zerga-iruzurra eta terrorismoaren finantzaketa. 2021ean, AIk finantza-delituak aztertzeko behar den denbora 20 astetik (giza analista baten baliokidea) 2 astera murriztu zuen, FTI aholkularitza-enpresaren arabera. 

    Web-eskalako edukien analisiaren inplikazioak

    Web-eskalako edukiaren analisiaren ondorio zabalagoak izan daitezke: 

    • Hizkuntzen itzulpen-teknologietan egindako aurrerapenak, AIren hitzen datu-base zabalagatik eta haien kulturan oinarritutako esanahiagatik.
    • Hizketan eta beste eduki motetan aniztasuna eta alborapenak hauteman eta ebaluatu ditzaketen tresnak. Ezaugarri hau erabilgarria izan daiteke iritzi-edizioen eta artikuluen benetakotasuna ebaluatzeko.
    • Sentimenduen azterketa hobetua, testu bati gako-hitz negatiboak edo positiboak esleitzeaz haratago eta erabiltzaileen sarean duten portaera osoaz gain.
    • Zibererasoen detekzio hobetua teknologiak hackerrek erabiltzen dituzten hitzak eta kodeak identifikatu ditzakeelako.
    • Eduki handien indexazio eta antolaketa hobeagoa epe luzean, gobernurako eta ikerketarako artxiboetarako erabilgarria izan daitekeena.

    Iruzkintzeko galderak

    • Zeintzuk dira sare sozialen moderazioan web-eskalako edukiaren analisiaren beste onura potentzialak?
    • Zeintzuk dira teknologia honen erabilera kasu posibleak beste industria batzuetan?

    Insight erreferentziak

    Ikuspegi honetarako honako lotura ezagun eta instituzional hauei erreferentzia egin zaie:

    Taylor & Francis Online Edukien analisia handitzea