Шта ChatGPT и Gemini знају о вама?
Кад год отворите нови разговор у ChatGPT-ју или Gemini-ју, ви не настављате стари разговор. Ви се обраћате некоме ко вас, технички гледано, први пут види.
Језгро сваког великог језичког модела (ЛЛМ) је систем без стања. То значи да модел нема ниједну трајну промену у себи која би могла настати након завршетка претходног разговора. Не постоји никаква интерна база у коју је записао ваше име, ваш пројекат, ваша упутства о формату одговора или ваш стил писања. Сваки пут кад притиснете „New chat“, почињете разговор из почетка.
Како онда ови АИ системи успевају да воде смислен разговор који траје сатима, а да не забораве шта сте рекли на почетку?
Трик је у интерфејсу, односно у чет бот апликацији коју користите, било да је ChatGPT, Gemini, Claude или Grok. Оно што ви не видите јесте да апликација, са сваким вашим новим питањем, у позадини пошаље моделу целу дотадашњу преписку: ваше прво питање, његов први одговор, ваше друго питање, његов други одговор, и тако редом.
Ако сте разменили двадесет порука, двадесет прво питање не иде само. Оно са собом „повуче“ читав разговор који садржи претходних двадесет питања и одговора. Модел, који треба да вам да одговор, сваки пут чита целу вашу конверзацију од почетка, огромном брзином, како би створио привид да се „сећа“ шта сте рекли пре десет минута, и генерише одговор иако целу конверзацију види први пут.
Ако се сећате, причали смо о томе да сваки модел има своју радну меморију, нешто што се зове контекстуални прозор. То је максималан број токена (делова речи) које модел може да „види“ одједном. Тај прозор има своју фиксну, непроменљиву величину. Како разговор тече, тако расте количина текста који се шаље моделу при сваком наредном питању. Када тај прозор попуните, тако што водите предугачак разговор, модел почиње да заборавља текст са самог почетка, јер почиње да брише најстарије поруке вашег разговора, како би могао да направи простор за нове поруке.
Али постоји и много већи проблем од простог заборављања. Трансформер архитектура на којој ови модели почивају има једну прилично незгодну особину. Када ви поставите питање, математички механизам унутар модела, који обрађује текст унутар контекстуалног прозора, мора да упореди сваку реч са сваком другом речју како би схватио тачан смисао. Када у тај прозор убаците двоструко више речи, рачунарска снага коју машина мора да употреби се учетворостручи. Ако убацимо три пута више текста, потребна рачунарска снага порасте девет пута, па самим тим порасте и потрошња струје и раубовање графичких картица које су веома скупе. Ово је квадратни раст потрошње ресурса у некој АИ фабрици која „производи“ одговоре на ваша питања. То значи да дугачке конверзације постају споре и скупе, а ви примећујете да одговори постају површни и да модел почиње да измишља ствари.
Да бисте и сами осетили ово ограничење, пробајте један једноставан експеримент када следећи пут будете водили неки изузетно дугачак разговор (преко 100.000 речи). Укуцајте следеће:
Игнориши нашу тренутну тему. Желим да тачно цитираш моје треће питање из овог разговора, реч по реч, и објасниш ми зашто сам те тада баш то питао.
Посматрајте како моделу треба много више времена него иначе да вам одговори, како почиње да халуцинира или потпуно промашује поенту ако је разговор био предугачак и због тога испао изван контекстуалног прозора.
Због оваквог понашања модела и енормне потрошње рачунарске снаге, инжењери су морали да осмисле нешто много паметније од сталног рециклирања целог разговора унедоглед. Решење је било очигледно: увели су меморијски простор изван контекстуалног прозора који не оптерећује модел при сваком кораку.
Док ви разговарате, алгоритам чет бот апликације у позадини дискретно бележи одређене чињенице о вама, за које „сматра“ да су релевантне и корисне за будуће разговоре. Ако успут, док постављате питања и решавате неки проблем, споменете да радите у рачуноводству и да не волите преопширна објашњења, он ће то записати у своју глобалну меморију. Следећи пут када покренете потпуно нов разговор, пре него што вам модел уопште одговори на прво питање, чет бот апликација ће прво „бацити поглед“ на сачуване податке у својој меморији, придружиће их вашем питању и послати моделу.
Циљ овог процеса је да смањимо понављање у комуникацији и да избегнемо оно напорно и досадно понављање инструкција сваки пут када треба да поставимо питање моделу и када му објашњавамо какве одговоре очекујемо, опширне или кратке, којим тоном, и сл.
Али меморија у ChatGPT-ју и меморија у Gemini-ју не раде на исти начин, и имају различите контроле. О томе ћемо сада да причамо.
ChatGPT: Два слоја памћења и како их подесити
ChatGPT користи два одвојена механизма памћења.
Сачуване меморије (Saved memories) су конкретне чињенице које је ChatGPT запамтио о вама. Или зато што сте му експлицитно рекли да их запамти, или зато што је сам „закључио“ да би нека информација могла бити корисна убудуће. На пример, ако напишете „запамти да сам финансијски директор“, он може то додати у листу сачуваних меморија и користити тај податак у сваком наредном разговору. Од априла 2025, ова меморија је проширена за Plus/Pro налоге: задржава се дужа историја разговора и прави се дубљи профил корисника. Код бесплатних налога меморија постоји, али је ограничена у обиму и трајању, и више се фокусира на скорије интеракције и мањи број детаља.
OpenAI нигде јавно не наводи могући максималан број меморија, ни тачан број речи по меморији; описује их само као кратак скуп корисних детаља (преференције, стилови, основне биографске информације) које ChatGPT апликација интерно одржава и по потреби спаја или брише. По незваничним информацијама из праксе, ова листа има отприлике 1.200 до 1.400 речи. Кад се попуни, не можете да додате нове меморије док не обришете неке старе, а систем често сам спаја сличне меморије и ажурира их, или понекад уклања старе.
Реферисање историје ћаскања (Chat history) је механизам који је уведен у априлу 2025. године. Овде ChatGPT не памти појединачне чињенице, већ може да приступи вашим претходним разговорима и из њих извуче контекст. Ако сте, рецимо, у неком ранијем разговору дискутовали о путовању у Барселону, он може то да искористи кад га следећи пут питате за препоруке за одмор, чак и ако нисте експлицитно рекли „запамти ово“.
Разлика између ове две меморије је значајна: сачуване меморије су увек присутне и шаљу се моделу са сваким вашим питањем. Историја ћаскања постоји више као могућност да ChatGPT претражи историју старих разговора ако и кад му затреба.
Како подесити меморију у ChatGPT-ју
Отворите ChatGPT у веб прегледачу или у апликацији. Кликните на своју профилну слику (доле лево на вебу, или кроз мени на мобилном) и изаберите Settings. Затим идите на Personalization. Ту ћете видети:
- Reference saved memories: укључује/искључује коришћење сачуваних меморија,
- Reference chat history: укључује/искључује коришћење претходних разговора.
Оба прекидача можете контролисати независно. Можете имати укључено један, оба или ниједан.
Изнад њих постоји опција Manage и када кликнете, видећете листу свега што је ChatGPT запамтио. Сачуване меморије можете обрисати кликом на три тачкице и избором Delete all memories, јер не постоји опција за брисање појединачних меморија. Ако желите да обришете појединачну меморију, прво је копирате из овог прегледа, а онда у чету напишете: обриши из меморије ... [налепите меморију коју сте копирали]. Систем ће вам приказати поруку: Updated saved memory и одговорити са „Обрисано из меморије“.
Други начин за преглед сачуване меморије је да директно у чету напишете:
Шта си упамтио о мени?
Када добијете одговор, који ће вас сигурно изненадити (мене увек изненади, јер постављам ово питање барем једном месечно), онда можете обрисати ставке које не желите да ChatGPT памти о вама, командом „обриши“ из претходног пасуса.
Ако сами желите да додате сталну меморију ChatGPT-ју онда у чету напишете:
Запамти да...
„Радим у области образовања и пословног саветовања, правим курсеве и едукативни садржај за одрасле.“
„Бавим се АИ алатима, аутоматизацијом и интеграцијама (API, Make, n8n, Zapier).“
„Увек одговарај на српском (ћирилица), осим ако експлицитно не тражим енглески.“
„Очекујем концизне и структуриране одговоре без коришћења листи.“
„Када је корисно, дај ми конкретне примере и кратке шаблоне (outline, checklist, template).“
„Често радим: дизајн курсева, припрему презентација, скрипти, радних свески и тестова.“
„Користим Google Workspace (Docs, Sheets, Slides, Gmail) и Claude Cowork као основне алате.“
„Знам Python и користим га за писање скрипти, аутоматизацију и прилагођавање садржаја.“
„Када тражим помоћ, претпостави да желим да добијем и предлоге за систематизацију и аутоматизацију процеса, а не само једнократно решење.“
Ево како можете директно тестирати да ли ради ваша инструкција за упис у меморију. Отворите нови разговор и напишите:
Запамти за све наше будуће разговоре да увек желим одговоре који имају максимално три реченице.
Затим затворите тај прозор. Отворите потпуно нови разговор и питајте нешто тривијално, рецимо како најбрже скувати пиринач. Одмах ћете видети промену у понашању. Ако не желите да добијате такве одговоре онда напишите: обриши из меморије да увек желим одговоре који имају максимално три реченице.
Привремени разговор (Temporary Chat)
Кад год желите да разговарате без икакве меморије и без остављања трага у историји разговора, користите Temporary Chat. Овај разговор не користи постојеће меморије и не ствара нове. Идеалан је за ситуације кад истражујете нешто што не желите да утиче на будуће одговоре.
Gemini: Лични контекст и активност
Gemini приступа памћењу другачије од ChatGPT-ја, делимично зато што је дубоко интегрисан у Google-ов екосистем.
Меморија (Personal context)
Gemini-јева меморија се налази у секцији коју Google назива Personal context. Кад је укључена, Гемини учи из ваших разговора тако што бележи ваше преференције, интересовања, стил писања и детаље које помињете. Можете му и експлицитно рећи да нешто запамти, али он и сам препознаје информације које би могле бити корисне.
Поред аутоматског памћења, ту су и Your instructions for Gemini, стална упутства која важе за све разговоре. На пример, можете написати да увек одговара као да вам је 15 година или да користи кратак формат одговора.
Gemini Apps Activity
Ово је засебна ставка од меморије. Gemini Apps Activity је комплетан дневник свих ваших разговора са Gemini-јем, сачуван у оквиру вашег Google налога. Google може користити ове податке за побољшање модела (ако сте то дозволили). Искључивање меморије не искључује аутоматски и Activity, јер су то два различита прекидача.
Како подесити меморију у Gemini-ју
Отворите Gemini у веб прегледачу. Кликните на икону зупчаника (⚙️) Settings & help, доле лево. Отвориће се панел за подешавања.
У секцији Personal context наћи ћете:
- Memory: прекидач који укључује/искључује учење из претходних разговора
- Your instructions for Gemini: део где можете додати стална упутства притиском на дугме +Add
Да прегледате шта је Гемини запамтио, можете га директно питати у разговору или приступити меморијама кроз подешавања.
За брисање појединачне меморије можете то урадити кроз разговор, као и код ChatGPT-ја:
Заборави да сам ти поменуо да се бавим програмирањем.
За управљање Activity-јем идите на myactivity.google.com/product/gemini и тамо можете контролисати дневник разговора.
Код Gemini-ја, архитектура овог менија се повремено мења како Google мења интерфејс, али суштина је увек унутар главних подешавања. Тражите секцију која управља сачуваним информацијама, напредним опцијама или меморијом. Google воли да те ствари дубље повеже са оним што већ зна о вама, али сам интерфејс за језички модел вам дозвољава да прегледате шта је тачно научио из ваших директних разговора.
Google је недавно додао могућност увоза меморије из ChatGPT-а или Claude-а. У подешавањима постоји опција Import memory to Gemini, где добијете промпт који копирате у другу чет бот апликацију, она генерише резиме ваших преференција, и тај резиме залепите назад у Gemini. Можете и отпремити ZIP архиву комплетне историје разговора из других чет апликација.
Зашто меморија може да постане проблем?
Меморија је корисна док ради у вашу корист. Ми, као људи, ретко водимо линеарне, савршено структуриране разговоре.
Рецимо да седнете да користите АИ како би вам помогао око неког сложеног уговора за клијента. Усред тог посла, зазвони вам телефон и колега из маркетинга вас пита где да води брата на италијанску храну. Ви у исти тај прозор за ћаскање укуцате питање о најбољем ресторану италијанске кухиње у Београду, и колеги пренесете одговор. Онда се сетите да нисте платили струју, а хоћете да искористите онај попуст од 7%, па поставите питање о томе који је последњи рок за плаћање рачуна, да би попуст био урачунат. Скачете са теме на тему. За вас је ово потпуно уобичајено радно поподне у канцеларији. За меморију чет бота, то је неред у најави.
Систем се увек труди да буде користан, јер је тако подешен, и покушава да повеже све те неповезане разговоре. Ако поменете било шта везано за храну, систем ће претпоставити да сте правник који воли италијанску храну и уз то сте заборавни јер имате проблема са рачунима за струју. Када се следећи пут вратите озбиљном послу, он ће можда покушати да вам правни савет да неким неформалним тоном, мислећи да сте ви онај опуштени љубитељ пасте од малопре. Меморија на овај начин постаје контаминирана. Ствари које немају апсолутно никакве везе једна са другом почињу да се преплићу у меморији чет бота.
Ово се посебно дешава код корисника који користе АИ са много различитих тема: пословне, личне, образовне, креативне или информативне. Свака од ових тема оставља трагове у меморији, и ти трагови се мешају јер модел нема способност да их сам категоризује на смислен начин.
Зато вам предлажем да обавезно урадите периодично чишћење меморије, и то барем једном месечно. Да бисте видели какав сте неред заправо направили током времена, пробајте следећи упит у новом прозору:
Дај ми апсолутно све чињенице, претпоставке и детаље које си до сада упамтио о мени кроз нашу интеракцију. Немој ништа да сакријеш, групиши их по темама како бих видео шта тачно држиш у својој меморији.
Резултат ће вас прилично изненадити.
Још једна корисна навика је да кад завршите разговор о некој привременој теми (разговор за забаву, једнократно истраживање, нешто што не желите да обоји будуће одговоре), пре затварања разговора експлицитно напишите:
Ово је био једнократан разговор. Немој запамтити ништа из ове сесије.
Или, још боље, за такве разговоре користите Temporary Chat, дугме за њега је обично у горњем десном углу прозора, или искључите меморију пре него што почнете.
Ми смо навикли да комуницирамо са живим људима, а људи инстинктивно филтрирају оно што је небитно. Знају када се шалите, а када сте озбиљни. Машина то не уме. Она памти све што јој кажете да запамти, или што статистички процени да вам је битно.
Једна ствар коју лако заборављамо док „разговарамо“ са чет ботом је да ниједан од ових система не разуме шта памти на начин на који ви то разумете. Он чува фрагменте текста и користи их статистички. Ваша је одговорност да те фрагменте повремено проверите зато што модел још увек није спреман да сам препозна кад нешто у меморији више не одговара реалности.
Повремено шаљемо мејл када имамо нешто што вреди прочитати.