Da li vam se nekad desilo da ste od ChatGPT-ja tražili predlog teksta na srpskom jeziku s određenim brojem karaktera, a dobili kraći tekst random dužine?
Zašto se to dešava (po ChatGPT-u):
- Dužinu teksta procenjuje po broju reči, ali ne broji karaktere.
- Ako proceni da se tekst može napisati kraće, često ga previše sažme. I opet ne broji karaktere.
- Instrukcije poput oko, približno, okvirno… model tumači prilično široko.
Kako se to rešava (po ChatGPT-u):
- Tražite mu da proveri dužinu teksta u karakterima pre nego što ga pošalje.
- Zadajte mu da tekst ne sme biti kraći od određenog broja karaktera.
- Dužinu teksta definišite kao broj reči – za srpski je 200 reči ≈ 1300 karaktera, 300 reči ≈ 1950 karaktera. Sa razmacima.
A šta se stvarno dešava po primeni predloženog:
Pod 1. troši najviše vremena. Verovatno piše, broji, briše, piše, broji… Ali i dalje ima ozbiljan problem sa brojem karaktera. Čak i posle naloga da ispravi grešku.
2. varijanta: zadati minimalni broj karaktera tumači pomalo široko…
Kod primene 3. rešenja inicijalno promaši, ali posle komentara da nije poslao traženi broj reči piše novi tekst koji maši za oko 7%, što je daleko bolje od inicijalnih 24%…
Očigledno, ChatGPT interno procenjuje dužinu teksta u rečima, a baratanje sa karakterima (sa razmakom) baš mu i ne ide. Dakle, uzmite da je prosečna srpska reč (sa razmakom) dužine 6,5 karaktera i – srećno.

