Kad AI broji - Pedya Milicevic’s Blog

Da li vam se nekad desilo da ste od ChatGPT-ja tražili predlog teksta na srpskom jeziku s određenim brojem karaktera, a dobili kraći tekst random dužine?

Zašto se to dešava (po ChatGPT-u):

Dužinu teksta procenjuje po broju reči, ali ne broji karaktere.
Ako proceni da se tekst može napisati kraće, često ga previše sažme. I opet ne broji karaktere.
Instrukcije poput oko, približno, okvirno… model tumači prilično široko.

Kako se to rešava (po ChatGPT-u):

Tražite mu da proveri dužinu teksta u karakterima pre nego što ga pošalje.
Zadajte mu da tekst ne sme biti kraći od određenog broja karaktera.
Dužinu teksta definišite kao broj reči – za srpski je 200 reči ≈ 1300 karaktera, 300 reči ≈ 1950 karaktera. Sa razmacima.

A šta se stvarno dešava po primeni predloženog:

Pod 1. troši najviše vremena. Verovatno piše, broji, briše, piše, broji… Ali i dalje ima ozbiljan problem sa brojem karaktera. Čak i posle naloga da ispravi grešku.

2. varijanta: zadati minimalni broj karaktera tumači pomalo široko…

Kod primene 3. rešenja inicijalno promaši, ali posle komentara da nije poslao traženi broj reči piše novi tekst koji maši za oko 7%, što je daleko bolje od inicijalnih 24%…

Očigledno, ChatGPT interno procenjuje dužinu teksta u rečima, a baratanje sa karakterima (sa razmakom) baš mu i ne ide. Dakle, uzmite da je prosečna srpska reč (sa razmakom) dužine 6,5 karaktera i – srećno.

Podelite, ako vam se sviđa:

Ostavite komentar Cancel reply