ROVATOK

FELADVÁNYOK

BETŰTÉSZTA

ASSZOGRAMMA

JÁTÉKOK

KVÍZJÁTÉK

FÓRUM

REGISZTRÁCIÓ

A mai nap képe

nap képe

Küldj be te is képet!
Képeslapküldés

Keresés az oldalon:

Friss fórum:
AI (4)
Feladványok (17684)
DINGIDUNGI (25)
játékos javítás (1699)
A nap képe (4298)
Játékok (1986)
Heti kvíz (1273)
csak úgy.. (4587)
Szívből szóló versek (1235)
Betűtészta (3190)
Ki mondta? (289)
asszogramma (1912)
A hét kérdése (2048)
Segítséget kérek, köszönöm (2525)
Tőlem Nektek (12500)

 > Még több fórum

A hét kérdése:

Jelentkezz be a heti kérdéshez!

 > régebbi kérdések
 > kérdés beküldés

Legolvasottabbak:
IQ teszt
Egy angliai egyetem kutatásai
Varázsgömb
Hipnózis
Agyscanner

DigitalAge >> Fórum >> Assistance

AI

Sorrend:  
Időzóna:
Méret:

Hirdetés


Svidrigailov

2025.10.25 10:08  | | 757475.

Egyébként érdekes a nyelvi modellek teljesítménye egyszerűbb matematikai feladatokon. Én eddig több száz, de valószínűleg 1000-nél is több feladaton próbáltam ki az OpenAI ChatGPT, Google Gemini és a kínai DeepSeek modellt.

Vannak köztük egyetemi vizsga- és zárthelyi feladatsoraim pl. Analízis, Lineáris algebra, Numerikus analízis és Gépi tanulás tárgyakból is, amikhez néha megoldókulcsot készítettem a hallgatóim részére, néha csak egy korábbi feladatsor módosítását és megoldását kértem az aktuális vizsgára (LaTeX forráskóddal). Vannak köztük diagos feladatok is; főleg olyankor, amikor elkap a hév és beküldök pár nap alatt 100-nál is több feladatmegoldást, és az amúgyis leterhelt javítókat nem szeretném hibás megoldásokkal fárasztani (ezúton is köszönöm mindenkinek a javitói munkáját), így ellenőrzésként több modellel is megoldatom azokat, miután én magam is végigszenvedtem a megoldást.

Sokan vannak, akik kipróbálták ezek valamelyik verzióját valamikor és néhány hibás vagy hallucinált válasz után elkönyvelték, hogy a nyelvi modellek nem alkalmasak főleg matek kérdések megválaszolására. Az én tapasztalatom viszont az, hogy ezek hónapok alatt is sokat fejlődtek, egyre jobbak és ha jól használjuk őket, nagyon hatékonyak tudunk lenni velük. Pár dolog, amire érdemes odafigyelni:

- Én szinte az összes feladatot megoldom magam is papíron előtte és leginkább ellenőrzésre használom őket, vagy ha nem is oldom végig, de tudom, milyen mechanikus lépésekre van szükség a megoldáshoz

- Több modellel is érdemes megoldatni ugyanazt a feladatot, ha hibáznak, jó eséllyel mást rontanak el (hacsak nem elvi hibáról van szó)

- Ha eltérő választ adnak, akkor vagy megkereshetjük és rámutathatunk a különbségre, vagy akár odaadhatjuk a saját megoldásunkat vagy másik nyelvi modell válaszát összehasonlításra

- Nyilván egy matematikus könnyebben észreveszi a hibákat, de a helyes hozzáállás szerintem az, hogy mindenképpen kritikusan olvassuk végig a válaszaikat, amit nagyban megkönnyít az, ha mi magunk is végigmentünk már egy megoldáson papíron, vagy legalábbis gondolkodtunk hosszabban a feladaton

- A számolások elvégzésére érdemes megkérni, hogy írjon Python-kódot, amit saját maguk is tudnak futtatni menet közben, lecsökkentve ezzel a hallucinált eredményeket, ill. kérhetünk olyan kódot, amit akár mi is le tudunk futtatni a saját gépünkön

- Lassabb, de érdemes a hosszabb Reasoning/Thinking üzemmódban futtatni őket, mert úgy van esélyük észrevenni és kijavítani a hibás gondolatokat

- Általános matematikai feladatokon a legjobb eredményeket nekem a kínai DeepSeek modell szokta hozni, csak képes perceket is eltölteni a megoldáson, viszont cserébe végig pontosan látjuk minden egyes gondolatát. Képekkel sajnos még nem tud megbirkózni.

- Kb. második helyen áll nálam a GPT5 Thinking módja, hatékonyan használ Python-kódot is a megoldás során és képi bemenetet is jól kezel

- A Google Gemini modellje inkább olyan kérdésekben erős, amik webes keresést igényelnek a megoldás során vagy képekkel is kell dolgozni, de a Pro (fizetős) verziója általános feladatokon is kiváló

- Képeket messze nem tudnak még tökéletesen kezelni, ezért ha olyan a feladat, érdemes leírni nekik pontosan, hogy mi van a képen

- Mechanikusabb, még a kevés ötlet nélküli geometriai feladatokon is jóval gyengébbek; ha pedig komoly ötlet is kell, akkor meg még inkább. Ennek ellenére a DeepSeek gyakran lassan, de biztosan végig tud számolni mechanikusabb feladatokat, különösen akkor, ha külön megkérjük, hogy koordináta-rendszerben számoljon

Vicces tény, hogy a nyelvi modellek nevükkel ellentétben a nyelvi, játékos feladatokon véreznek el a leginkább, különösen magyar nyelven. Jópár diagos nyelvi feladaton kipróbáltam, hogy mit tudnak és elég siralmas a teljesítményük. Ennek a mélyebb oka abban keresendő, hogy nem betűk szintjén értelmezik alapból a szavakat, hanem "token"-ekre (betűcsoportokra, "szótagokra" bontva, így külső segítség, pl. Python-kód nélkül nem tudják helyesen ellenőrizni magukat, ezért ezt érdemes külön kérni tőlük. Ezzel az eszközzel rá tudjuk őket kényszeríteni, hogy csak ellenőrzött, helyes választ adjanak, folyamatosan iterálva, javítva magukat amíg el nem érnek hozzá vagy fel nem adják. Néha egészen meglepő, hogy milyen feladatokat meg tudnak így oldani.

 
cslaci

2025.10.25 08:56  | | 757474.

Megoldás:
20

 
Svidrigailov

2025.10.25 08:56  | | 757473.

A ChatGPT (aminek az egyik verziója fut az Edge Copilot mögött is) felemás eredményt hozott.

Ha "Instant" módban azonnal válaszol, akkor rossz választ ad. Ha hagyjuk gondolkodni "Thinking" üzemmódban, akkor helyesen megoldja. Nyilván egyébként van véletlenszerűség is a válaszban, ez csak 1-1 kísérlet eredménye.

 
hata

2025.10.25 08:40  | | 757472.


Egy feladattal érdekes kísérletet végeztem a mesterséges intelligenciával.
Edge Copilot összekeverte a számokat, így nem is jó a megoldása
Google AI Szép logikus levezetéssel jól oldotta meg.
Nem írom le a megoldást, de érdemes kipróbálni. Nekem nagyon érdekes volt.

 


Felhasználónév:

Jelszó:

Jelszóemlékeztető



Friss feladványok:
 Torony
 Móricka a magyarórán
 Borban az igazság 2.
 Fuss Forrest!
 Más szóval 2.
 Szám(szám+5)
 faktorösszeg

Hirdetés

© 2017 DigitalAge

impresszum  ::  médiaajánlat  ::  segítség  ::  ajánló  ::  kezdőlapnak  ::  kedvencekhez   RSS