Ako zistiť, že text bol napísaný neurónovou sieťou
Rôzne / / August 21, 2023
Umelá inteligencia je dobrým pomocníkom v mnohých oblastiach. Nemali by ste mu však bezvýhradne dôverovať.
Autor: údajov Bloomberg, približne 30 % špecialistov používa na generovanie textu neurónové siete. V Rusku 67 % opýtaných chcete uplatniť v práci umelej inteligencie, aby menej pracoval a neprišiel o príjem. To len taká štatistika nepoteší všetkých zákazníkov. Niektorí neveria neurónovým sieťam, preto uprednostňujú, aby texty nepísali roboti, ale ľudia.
Chápeme, prečo sa zákazníci obávajú technológií a aké prostriedky na odhalenie neurotextov dnes existujú.
Prečo by sa s textami z neurónových sietí malo zaobchádzať opatrne
Tu sú hlavné dôvody, prečo sa zákazníci obávajú takýchto článkov.
Riziko porušenia autorských práv
Dnes neexistuje oficiálne stanovisko k otázke kto patria autorské práva na texty vytvorené pomocou AI. Autorom je podľa zákona ten, kto tvorí dielo tvorivou alebo duševnou prácou. Avšak v prípade neurónová sieť ľudia len dávajú pokyny, ale sami nepíšu.
Keďže zákon neuznáva neurotexty ako predmety autorského práva, pravidlá používania obsahu generovaného technológiami sú určené v používateľskej dohode neurónovej siete.
A ak OpenAI vysiela práva na text aj v bezplatnej verzii, potom Gerwin limity jeho použitie na politické, diskriminačné účely alebo v nevýhodnej reklame. A v stredná cesta používať obsah na komerčné účely Môcť iba ak je produkt generovaný za platenú sadzbu.
Riziko získania nejedinečných alebo nepresných informácií
Neurónová sieť prijme požiadavku, prejde ju cez algoritmy, analyzuje dostupné informácie o danej téme a vydá odpoveď. Bez popierania, že rovnaká požiadavka od iného používateľa môže vytvoriť podobný alebo podobný text.
A tu prichádza nové nebezpečenstvo. Vedci z Cornell University prišli s záver: ak sa odpovede neurónovej siete na rovnakú otázku veľmi líšia, potom s vysokou pravdepodobnosťou prichádza s faktami.
Riziko, že neurotexty znížia zdroje spoločnosti vo výsledkoch vyhľadávania
Koncom minulého roka Google špecialista na kvalitu Duy Nguyen vyhlásilže spoločnosť má zavedené algoritmy na zisťovanie a downgrade vytvoreného obsahu umela inteligencia. Mnohí sa preto obávajú, že vyhľadávače budú vyhľadávať takýto obsah a pesimizovať ho. Teda na zníženie pozície vo výsledkoch vyhľadávania.
Precedensy už existujú. Napríklad obchodník Neil Patel strávil experimentovaťvytvorením 50 testovacích webov, ktoré rozdelil do dvoch skupín. Odborník zaplnil stránky prvého dielu článkami vytvorenými výlučne umelou inteligenciou. Stránky druhého hostili články o AI upravené ľuďmi, ako aj materiály napísané copywritermi bez použitia neurónových sietí.
Výsledky experimentu ukázali, že zdroje prvej skupiny stratili niekoľko pozícií vo výsledkoch vyhľadávania. A to viedlo k znížiť návštevnosť až 70 %.
Zástupcovia Google zároveň dodali, že majú pozitívny vzťah k rozvoju neurónových sietí a vytvorili si už aj svoje Chatbot Bard. Pre spoločnosť sú však prioritou kvalitné texty. Systém, ktorý zoraďuje výsledky, v prvom rade ponúka používateľom materiály, ktoré spĺňajú štandardy E-E-A-T (skúsenosti, kompetencie, dôveryhodnosť, dôveryhodnosť).
Texty, ktoré im zodpovedajú, vzbudzujú dôveru a považujú sa za užitočné, pretože obsahujú príklady, skúsenosti, analytickú časť, výskum. A obsah, ktorý vytvárajú neurónové siete, bez dodatočného hlbokého spresnenia osobou, často taký nie je.
Medzitým v Štátnej dume navrhol zaviesť označovanie materiálov vytvorených pomocou AI. Kým sa tak nestane, určite text generované neurónovou sieťou, budete to musieť urobiť sami. Alebo pomocou špeciálnych služieb.
Ako nezávisle určiť, že text bol napísaný neurónovou sieťou
Nedávno sa konala technologická univerzita MIREA experimentovať, ktorej sa zúčastnilo 20 pedagógov a vyše 200 žiakov. Polovica z nich písala vedecké práce samostatne. A zvyšných 50 % využilo pomoc neurónových sietí. Učitelia na druhej strane museli takéto materiály AI vypočítať.
K tomu učitelia dbali na štylistické a pravopisné črty textu. Napríklad pre veľké množstvo opakujúcich sa slov a významov, skutočných a logických chyby, nedostatok pôvodných rozsudkov. Učitelia tak dokázali identifikovať 96 % prác napísaných pomocou neurónovej siete. 4 % študentov, ktorí neboli vystavení, priznali, že strávili veľa hodín úpravou textu AI.
Neexistuje univerzálny návod, ktorý by pomohol vypočítať text generovaný neurónovou sieťou. Experiment však ukazuje, že podobné vzory sú vlastné takýmto materiálom. Zvážme ich podrobnejšie.
Opakovanie významov a slov
Jedným z dôvodov poklesu stránky vo výsledkoch vyhľadávania je opätovná optimalizácia kľúčových slov. Neurónová sieť v reakcii na požiadavku často „odpovedá v kruhu“. Niekedy používa rôzne výskyty, ale význam sa stále opakuje.
Takže na snímke obrazovky nižšie mala umelá inteligencia za úlohu napísať predajný príspevok o novom, šetrnom spôsobe farbenia vlasov. A v malom texte neurónová sieť opakovane opakovala tie isté tézy.
Takmer každá veta vygenerovaný text opakuje sa fráza "nový spôsob farbenia". A taktiež dochádza k opakovanému zdvojovaniu významov o bezpečnosti metódy a individuálnom prístupe, ktorý zdôrazní jedinečnosť každého klienta.
Tu je niekoľko citátov z textu, ktoré to ilustrujú: „premeňte svoj obraz a vyjadrite svoju individualitu“, „vezmite do úvahy svoju individualitu“, „vhodné pre vás“, „vytvorte pre vás jedinečný a štýlový vzhľad“, „urobte svoj účes jedinečným“, „zachovajte zdravie a lesk vašich vlasov“, „bezpečné pre vaše vlasy“, „starostlivosť o vlasy, ich zachovanie zdravie“.
Medzitým stačilo raz spomenúť, že v salóne bola predstavená nová procedúra - sparing metóda farbeniaktorý udrží vlasy pri živote. A tiež vysvetliť, ako metóda funguje, v čom je novinka a prečo je bezpečná. A pridajte, že farebná paleta je rôznorodá a majstri, ktorí boli vyškolení, nielenže vykonajú sfarbenie vo vysokej kvalite, ale pomôžu aj s výberom farby.
Prítomnosť veľkého množstva pečiatok a klišé v texte, nedostatok zmyslového zážitku
Príklad sfarbenia tiež ukazuje, že neurónová sieť nemôže napodobňovať, ako človek hovorí v reálnom živote. Ľudia zapečatiť, použiť slang a skratky, zámerne skresľujú slová. Takáto prezentácia pomáha upútať pozornosť, vyvolať emócie, sprostredkovať pozíciu autora, jeho zmyslové skúsenosti.
Výskum ukázať: neurónová sieť nezdieľa pocity, neprijíma nikoho pozície. Preto uprednostňuje neutralitu, klišé a klišé. Vo vyššie uvedenom príklade ide o „odborné zručnosti“, „vysokokvalitné materiály“, „jedinečnú príležitosť“.
Neurónová sieť zároveň generuje texty v rôznych štýloch. Môžete jej napríklad dať za úlohu pripraviť materiál na tému „Čo ovplyvňuje náklady na oleja». Ale aby som si ujasnil, že text by nemal byť písaný suchým jazykom, ale s pridaním metafor a prirovnaní. Výsledok je však stále umelý. Umelá inteligencia totiž nemá žiadnu mieru, „necíti“ text tak, ako to robí človek.
1 / 0
2 / 0
Jeden z odsekov pomôže pochopiť, že získaný výsledok nemožno porovnávať s intonáciou, ktorá je vlastná človeku: „Dopyt a ponuka sú ako tanec dvoch milencov na trhu s ropou. Ak dopyt po rope stúpa ako rozbúrený oceán, a ak ponuka nestíha, ceny stúpajú ako šampanské na silvestrovskej párty. Ale ak dopyt klesne a ponuka sa zvýši, ceny môžu klesnúť ako balón na detskej oslave.“
Text pôsobí umelo a väčšina odbočiek v ňom nie je na mieste. A hoci sa príspevok skutočne ukázal ako „nesuchý“, je ťažké si predstaviť, že by to takto napísal odborník. Navyše doslova každá veta je metaforou a prirovnaním. Takéto techniky by však mali byť presné a úhľadne vložené do textu. V opačnom prípade sa stratí zmysel za prebytkom obrázkov.
Prítomnosť nezmyselných fráz a nedostatok logiky
Lingvista Noam Chomsky vo svojej knihe Syntactic Structures poznamenáva, že gramaticky správna konštrukcia fráz vo vete nezaručuje prítomnosť logika a zmysel. Ako príklad odborník uviedol frázu bezfarebné zelené nápady spia zúrivo – „bezfarebné zelené nápady spia zúrivo“.
Algoritmy pomáhajú neurónovej sieti vytvárať správne vety z hľadiska gramatiky. Pre AI však neexistuje pojem „význam“. A pre každý odsek to môže mať svoju logiku, keďže materiál sa získava z rôznych zdrojov.
Neurónová sieť bola napríklad požiadaná, aby vygenerovala recenzie na sprchový gél a teplákovú súpravu. Text o oblečení dopadol takto: „S pomocou obleku si môžete oddýchnuť, ponoriť sa do sveta športu a tiež ísť na prechádzku. Disponuje reguláciou teploty, vďaka čomu sa cítite pohodlne v každej situácii.
A tu je recenzia na sprchový gél: “Úžasný gél, netečie, nezaťažuje pokožku. Balené vo vrecúšku, v krabici, s vrchnákom. Netreba čakať na nič extra, aby sa trochu mrvila. Možno použiť ako nočný sprchový gél.
Niektoré frázy v nich dobre stavaný, no zároveň pôsobia absurdne a pripomínajú Chomského ilustráciu.
Nedostatok textúry a povrchné príklady
Umelá inteligencia podáva v textoch zrejmé informácie, všeobecné fakty, používa zjednodušené frázy a príklady, ktoré otázku príliš neprezrádzajú. V tomto prípade nezáleží na zložitosti témy. Otázka môže byť hlboká, napríklad vyhliadky na rozvoj inklúzie v Rusku. Alebo jednoduchšie a individuálne, čo sa týka výberu techniky.
V texte o inklúzii neurónová sieť povedala, aká dôležitá a relevantná je táto téma. Dodala tiež, že inklúzia je dlhodobý proces, ktorý sprevádzajú ťažkosti, no pracuje sa na vytváraní podmienok pre ľudí so špeciálnymi potrebami. A zhrnuté: ak sa nezastavíte, vývoj určite bude.
To, čo je napísané, však neodpovedá na otázku. Je dôležité, aby bol text konkrétny. Môžete napríklad analyzovať, ktoré z prijatých zákonov fungujú a ktoré nie a prečo. Prezradiť zahraničné skúsenosti. A vysvetliť, aké konkrétne kroky môže štát, biznis a každý človek ešte podniknúť na rozvoj inklúzie.
V texte o nákup smartfónugenerované neurónovou sieťou sú tiež uvedené zrejmé faktory výberu. Napríklad: mali by ste sa rozhodnúť pre operačný systém (iOS alebo Android), značku, prečítať si recenzie a technické špecifikácie a tiež vziať do úvahy svoje vlastné možnosti.
1 / 0
2 / 0
Ľudia to však chápu. Ďalšou vecou je hovoriť o čipoch operačných systémov, aby sme naznačili obmedzenia, ktoré v súčasnosti existujú. Alebo spomeňme inovatívne riešenia – napríklad technológiu eSIM, ktorá umožňuje mať v jednom smartfóne až päť čísel. Alebo zdieľajte predražené modely zariadení a ich náprotivky za najlepšiu cenu.
Prekrúcanie faktov, dopĺňanie vymyslených informácií
Neurónová sieť vierohodne odpovedá na takmer akúkoľvek otázku, poskytuje kroniku, dátumy, priezviská, históriu pôvodu. V tomto prípade sú informácie skreslené alebo úplne vymyslené. Takáto chyba v práci AI sa nazýva halucinácia.
Neurónová sieť teda dostala za úlohu rozprávať o slávnom nepočujúcichktorí veľkou mierou prispeli k rozvoju spoločnosti. V dôsledku toho väčšinu z nich vynašla AI.
1 / 0
2 / 0
Napríklad astronaut Raymond Lou alebo boxer Mario Gallegos. A 42. prezidentom Spojených štátov stále nebol Matthew Clinton, ale Bill Clinton. A nestratil sluch.
Okrem toho AI s istotou odpovedala na požiadavku „napíšte príspevok o kreatíve amnézia». Aj keď taký termín neexistuje.
Na otázku, prečo si bot vymýšľa ľudí a hovorí o neexistujúcich výrazoch, sa len ospravedlňuje za možný zmätok.
1 / 0
2 / 0
Keď sa falošné fakty prepletú s pravdivými údajmi, je ťažšie odhaliť halucinácie neurónovej siete. Najmä keď plynulé čítanie. Ak sa však sústredíte na príklady uvedené v texte, môžete si všimnúť tie, ktoré vyzerajú podozrivo, a skontrolovať ich zadaním do vyhľadávacieho panela.
Nedostatok aktuálnych informácií o aktuálnych zmenách, udalostiach
Neurónové siete sa pri komunikácii s používateľmi samy učia, pamätajú si objasnenia osoby, jej reakcie na vytvorený obsah, príklady, ktoré osoba zdieľa s botom. Odborníci poznamenalže schopnosť AI sa samoučiť ich prekvapila. A že táto zručnosť pomáha neurónovým sieťam zlepšovať sa.
V čom strojové učenie, vedená vývojármi na gigabajtoch dát – články, knihy, texty z webu – má jasný začiatok a koniec. A neurónové siete v podstate nemajú prístup k vyhľadávačom. Preto informácie, ktoré sa objavili po školení vykonanom vývojármi, nie sú pre AI dostupné až do ďalšej fázy.
Zároveň je interval medzi strojovým učením mesiace a niekedy aj roky. Pokrok sa samozrejme nezastaví: napríklad v máji tohto roku sa GPT Plus sprístupnil používateľom s plateným odberom ChatGPT s prístupom na internet. Väčšina neurónových sietí, najmä ich bezplatných verzií, však zatiaľ takúto možnosť nemá.
Základ bezplatnej verzie ChatGPT4 je teda obmedzený na rok 2021, takže robot nevie, kto vyhral posledné majstrovstvá sveta v roku 2022. A neurónová sieť Google – Bard AI – priznala, že nedokáže napísať text o významných udalostiach, ktoré sa vo svete odohrali toto leto.
1 / 0
2 / 0
Od jej posledného školenia, ktoré vykonali vývojári v máji 2023, leto pre Bard AI ešte neprišlo.
V takýchto prípadoch neurónové siete zvyčajne neprichádzajú s faktami, ale pripúšťajú, že nemôžu“predpovedať budúcnosť».
Ak text neobsahuje aktuálne informácie k téme alebo vyzerá odtrhnutý od reality, keďže sa toho v poslednom čase veľa zmenilo, existuje možnosť, že materiál napísala neurónová sieť.
Aké služby môžu pomôcť
Text generovaný umelou inteligenciou je možné rozpoznať aj pomocou samotnej neurónovej siete. Napríklad môže bot GPT-4. Pomôcť môžu aj špeciálne služby, ktoré dokážu odhaliť algoritmy AI. Pozrime sa na niektoré z nich nižšie.
- Text.ru. Stránka je umiestnená ako copywriting a výmena proti plagiátorstvu. No nedávno sa na portáli objavil platený neuroasistent. Jednou z jeho funkcií je detektor AI. Text, ktorý sa má skontrolovať, by sa mal načítať do okna. Po niekoľkých sekundách systém zobrazí výsledok.
- PR CY. Do služby môžete nahrať texty od 1 000 znakov. Zároveň sú na portáli objasnenia: nekvalitné, spamované možnosti, ktoré človek napísal, bude systém považovať za výsledok práce AI. Rovnako ako texty s jasným štylistickým zafarbením - napríklad podobným dielam Majakovského.
- GPTZero. Nástroj číta zložitosť, kombináciu slov, štruktúru a dĺžku viet. Ak sa však služba dobre vyrovná s textami v angličtine, potom pri načítaní materiálu v ruskom jazyku často zobrazuje chybu. Z výhod - prítomnosť bezplatnej verzie.
Neurónová sieť môže byť skvelým pomocníkom. Napríklad pri hľadaní nápadov. Úplne dôverovať jej obsahu je však nebezpečné. S materiálmi AI by ste mali zaobchádzať zodpovedne: upravovať spam, kontrolovať presnosť, logiku a relevantnosť faktov. A prispôsobiť štýl „ľudskému“ jazyku, aby ste nevystrašili publikum, zachránili reputáciu a pozíciu firmy vo výsledkoch vyhľadávania.
Prečítajte si tiež🤖
- 6 dôvodov, prečo by ste nemali slepo dôverovať umelej inteligencii
- Ako pridať robota do Discordu
- 6 neurónových sietí na vytváranie log