GPT-4 ratuje psa przed śmiercią – brzmi jak clickbait, ale tym razem to realny case study, który obiegł media technologiczne i weterynaryjne. Właścicielka suczki o imieniu Sassy, po serii niejednoznacznych wizyt u weterynarzy, w desperacji wprowadziła wyniki badań krwi do ChatGPT-4. Model zasugerował diagnozę IMHA (autoimmunologicznej niedokrwistości hemolitycznej), co potwierdziły dalsze badania i – po wdrożeniu leczenia – uratowało psu życie.
Dlaczego ta historia ma znaczenie dla świata technologii, a nie tylko dla miłośników zwierząt? Bo pokazuje bardzo konkretny przykład, jak zastosowania sztucznej inteligencji wychodzą poza typowe użycia typu generowanie tekstu czy kodu. To realny, kliniczny przypadek, w którym AI diagnoza zadziałała szybciej niż człowiek. Nie oznacza to, że czas porzucić weterynarzy na rzecz chatbotów, ale że wchodzimy w etap, w którym medyczne zastosowania ChatGPT i innych LLM przestają być futurystyczną wizją, a stają się narzędziem wspierającym proces kliniczny.
W praktyce oznacza to, że warto przyjrzeć się historii Sassy z perspektywy technologicznej: jak dokładnie wyglądało wnioskowanie modeli językowych w tym przypadku, gdzie są granice takiego podejścia, jakie są ryzyka, oraz co to oznacza dla przyszłości narzędzi typu ChatGPT w medycynie i weterynarii.
Przypadek Sassy – jak GPT-4 ratuje psa w praktyce
Od niespecyficznych objawów do trafnej AI diagnozy
Opis przypadku w dużym skrócie, na podstawie relacji właściciela:
- pies zaczął wykazywać niespecyficzne objawy – apatia, brak apetytu, zmęczenie;
- pierwsze wizyty u lekarzy weterynarii nie przyniosły jasnej diagnozy; sugerowano m.in. infekcję, problemy gastryczne;
- wykonano badania krwi – wyniki odbiegały od normy, ale obraz nie był dla lekarza jednoznaczny;
- właściciel w desperacji wkleił szczegółowe wyniki badań do ChatGPT-4 z prośbą o analizę;
- ChatGPT weterynaria (czyli de facto model GPT-4 użyty w kontekście weterynaryjnym) zasugerował: to może być IMHA – choroba autoimmunologiczna prowadząca do destrukcji czerwonych krwinek;
- właściciel wrócił z tą sugestią do weterynarza, wykonano dalszą diagnostykę, potwierdzono IMHA i wdrożono leczenie immunosupresyjne – pies przeżył.
Ważne: GPT-4 nie „postawił diagnozy” w sensie prawnym czy medycznym – dostarczył hipotezę diagnostyczną, której nie miał lekarz, a która po weryfikacji okazała się trafna. To subtelna, ale krytyczna różnica z punktu widzenia odpowiedzialności.
Co dokładnie zrobił model – od promptu do odpowiedzi
Z technologicznego punktu widzenia, cała magia sprowadza się do dobrze przygotowanego promptu i możliwości, jakie dają duże modele językowe:
- właściciel przekleił surowe dane: wartości RBC, HCT, HGB, MCV, MCHC, poziomy bilirubiny, odchylenia od normy itd.;
- GPT-4 zinterpretował liczby w kontekście typowego profilu pacjenta – psa w określonym wieku i stanie klinicznym;
- model porównał wzorzec odchyleń z milionami przykładów opisowych, na których był trenowany (dokumentacja medyczna, podręczniki, artykuły popularyzatorskie, Q&A itd.);
- na tej podstawie wygenerował listę możliwych rozpoznań, z IMHA na czele, wraz z uzasadnieniem i sugestią dalszych badań.
Z perspektywy inżynierskiej mamy tu klasyczny pipeline:
Input (prompt) -> Parsing liczb i kontekstu -> Wnioskowanie statystyczne (pattern matching) -> Generacja tekstu (diagnozy różnicowe + rekomendacje)
Nie ma w tym żadnej „magii” – jest głęboka statystyka, ogromny korpus treningowy i bardzo skuteczny mechanizm kojarzenia wzorców.
Jak GPT-4 myśli – wnioskowanie modeli językowych w diagnozie
LLM jako silnik korelacji, nie wiedzy medycznej
Modele takie jak GPT-4 nie mają „świadomości medycznej”, ale znakomicie radzą sobie z:
- rozpoznawaniem typowych kombinacji objawów i wyników badań;
- kojarzeniem rzadkich wzorców (np. specyficzny profil anemii + żółtaczka + pewne odchylenia biochemiczne);
- generowaniem listy hipotez, które człowiek mógłby przeoczyć, szczególnie pod presją czasu.
Ciekawostka: w badaniach z 2023–2024 r. wykazano, że GPT-4 w testach case’ów klinicznych osiąga skuteczność porównywalną z lekarzami rezydentami przy formułowaniu diagnostyki różnicowej. To nie oznacza, że zastąpi specjalistę, ale że może być realnym wsparciem.
Wniosek: diagnostyka medyczna AI w wydaniu LLM to dziś przede wszystkim system „co-pilot” – narzędzie drugiej opinii, które może wskazać trop, ale nie podejmuje decyzji terapeutycznych.
Porównanie z klasycznymi systemami decision support
W medycynie od lat stosuje się systemy Clinical Decision Support (CDS) oparte na expert systems, które korzystają z reguł typu IF X AND Y THEN Z. GPT-4 działa zupełnie inaczej:
| Cecha | Klasyczny CDS | GPT-4 / LLM |
|---|---|---|
| Mechanizm | Reguły eksperckie, drzewka decyzyjne | Probabilistyczne przewidywanie kolejnych tokenów |
| Aktualizacja wiedzy | Ręczne dodawanie reguł | Retraining / fine-tuning na nowych danych |
| Wyjaśnialność | Wysoka (jawne reguły) | Niska (black box) |
| Dostosowanie do kontekstu | Ograniczone | Wysokie – model uwzględnia cały prompt |
Uwaga: w weterynarii takich narzędzi CDS jest jeszcze mniej niż w medycynie ludzkiej, co sprawia, że „ogólne” modele typu GPT-4 stają się atrakcyjną protezą brakującej infrastruktury cyfrowej.
Limitacje i ryzyka – kiedy ChatGPT w weterynarii może zaszkodzić
Hallucinations i fałszywa pewność
Największy problem z użyciem LLM w medycynie i weterynarii to tzw. hallucinations – sytuacja, w której model generuje brzmiącą sensownie, lecz błędną odpowiedź.
W przypadku Sassy mieliśmy szczęśliwy zbieg okoliczności: GPT-4 mocno „trafił” w IMHA i właściciel potraktował to jako impuls do dalszej diagnostyki, nie jako gotowe rozpoznanie. Ale równie dobrze model mógł:
- zaproponować błędne, rzadkie schorzenie i przestraszyć opiekuna;
- zbagatelizować poważne objawy jako niegroźne;
- podać nieaktualne zalecenia terapeutyczne.
Ważne: oficjalnie OpenAI i inni dostawcy podkreślają, że modele typu ChatGPT nie są wyrobami medycznymi i nie powinny być używane do samodzielnej diagnostyki. To nie jest kwestia PR-u, tylko realnego ryzyka prawnego i klinicznego.
Brak dostępu do pełnego obrazu klinicznego
AI widzi tylko to, co jej wkleimy w prompt. Nie zobaczy błony śluzowej, nie wyczuje tętna, nie oceni oddechu. Oznacza to, że:
- bez pełnych danych odpowiedź zawsze jest częściowa;
- model może pominąć kluczowe elementy, których właściciel psa nawet nie wspomni w opisie;
- brakuje feedback loop – GPT-4 nie ma dostępu do dalszego przebiegu leczenia, chyba że użytkownik ręcznie zaktualizuje historię.
Dlatego w profesjonalnych wdrożeniach medycznych LLM integruje się z systemami EHR (Electronic Health Record) lub dedykowanymi aplikacjami, które pilnują kompletności danych. W weterynarii to dopiero raczkuje, zwłaszcza w Europie.
Konkrety techniczne – co jest pod maską GPT-4
Model, parametry, koszty użycia
OpenAI nie ujawnia oficjalnej liczby parametrów GPT-4, ale szacunki branżowe mówią o dziesiątkach, a nawet ponad 100 mld parametrów. W zastosowaniach takich jak przypadek Sassy kluczowe są:
- długi context window – możliwość podania wielu wyników badań, opisów objawów i historii choroby w jednym zapytaniu;
- multitask learning – model jest w stanie w jednym przebiegu „zrozumieć” tabelaryczne dane z badania, tekstowy opis i pytanie użytkownika;
- instruction tuning – GPT-4 jest zoptymalizowany do odpowiadania jak asystent, co pozwala generować listę możliwych rozpoznań i sugerować kolejne kroki, a nie tylko „strzelać” jedną diagnozą.
Z perspektywy dewelopera chcącego zbudować aplikację wspierającą weterynarzy w Polsce, dochodzą jeszcze kwestie kosztów:
- API GPT-4 (tekst) rozliczane jest zwykle per 1K tokenów; przy typowym case’ie (opis + wyniki) jesteśmy w zakresie kilkudziesięciu centów za jedno zapytanie;
- dla klinik z dużym wolumenem może to być istotny koszt operacyjny, ale wciąż niższy niż budowa własnego modelu foundation od zera;
- realną opcją jest fine-tuning mniejszego modelu (np. GPT-4 mini, czy open-source typu Llama 3) na danych weterynaryjnych, choć to wymaga współpracy z uczelniami i klinikami.
Integracja z workflow weterynaryjnym
Aby przejść od „jednorazowego użycia przez właściciela psa” do stabilnego narzędzia dla lekarzy, potrzebny jest sensowny stack:
- Backend: serwer pośredniczący (np. w Python/Node.js), który komunikuje się z API GPT-4;
- Warstwa bezpieczeństwa: anonimizacja danych, szyfrowanie, kontrola dostępu;
- UI dla kliniki: webowa aplikacja, w której weterynarz wprowadza dane (wyniki badań, objawy, historię);
- Prompt engineering: predefiniowane szablony promptów, które wymuszają na modelu określoną strukturę odpowiedzi (np. lista diagnoz różnicowych + poziom pewności + zalecane dalsze badania).
Wskazówka dla deweloperów: w praktyce najlepiej działa podejście „chain-of-thought lite” – proszenie modelu o rozpisanie kroków rozumowania (bez ujawniania ich użytkownikowi końcowemu), co poprawia trafność odpowiedzi w złożonych przypadkach.
Co dalej – przyszłość AI w medycynie i weterynarii
Od historii Sassy do regulowanych produktów medycznych
Już dziś powstają startupy rozwijające wyspecjalizowane modele dla diagnostyki obrazowej (radiologia, USG), analizy wyników laboratoryjnych czy triage’u pacjentów. Weterynaria zwykle dostaje te innowacje z opóźnieniem, ale paradoksalnie ma nieco niższe bariery regulacyjne niż medycyna ludzka, co może przyspieszyć adopcję.
Na polskim rynku można spodziewać się w najbliższych latach:
- lokalnych SaaS-ów dla klinik weterynaryjnych z modułem AI do wstępnej analizy case’u;
- integracji LLM z systemami do zarządzania przychodniami (karty pacjentów, billing, przypomnienia o szczepieniach);
- narzędzi edukacyjnych dla właścicieli zwierząt, które będą pomagały lepiej opisać objawy i przygotować się do wizyty, zamiast „diagnozować przez internet”.
Uwaga: zgodnie z europejskim AI Act, systemy wysokiego ryzyka w medycynie będą podlegać certyfikacji i audytom. Produkty oparte o GPT-4 w diagnostyce weterynaryjnej mogą zostać częściowo objęte podobnymi wymogami, jeśli będą realnie wpływać na decyzje terapeutyczne.
Dlaczego ten case study jest ważny dla branży tech
Historia „GPT-4 ratuje psa” to nie jest tylko viral, ale sygnał, że:
- LLM-y osiągnęły poziom, na którym spontaniczne, „amatorskie” użycie bywa klinicznie wartościowe;
- tworzenie dedykowanych, odpowiedzialnych narzędzi medycznych na bazie tych modeli ma ogromny sens biznesowy;
- deweloperzy i firmy nie mogą już ignorować aspektu etycznego i regulacyjnego – budowa AI w medycynie to nie kolejna „appka na weekend”.
Warto też pamiętać, że podobne historie zdarzają się po cichu w medycynie ludzkiej – lekarze i pacjenci korzystają z ChatGPT jako z „smart Google’a”. Ta praktyka i tak będzie się rozszerzać, niezależnie od formalnych zakazów. Rolą branży technologicznej jest więc raczej ucywilizować i ustrukturyzować te zastosowania, niż udawać, że ich nie ma.
AI jako co-pilot, nie bohater filmu
GPT-4 uratował psa – ale tylko dlatego, że:
- właściciel miał dostęp do wyników badań w formie cyfrowej;
- potrafił ich użyć w sensownym promptcie;
- traktował odpowiedź AI jako sugestię, a nie wyrok;
- weterynarz był otwarty na zweryfikowanie hipotezy zgłoszonej przez „chatbota”.
Dla czytelników digitalsite.pl wniosek jest prosty: zastosowania sztucznej inteligencji w stylu „medyczne zastosowania ChatGPT” to nie science fiction, tylko realny obszar, w którym już dziś można budować produkty – ale trzeba to robić odpowiedzialnie, z udziałem ekspertów, z myślą o bezpieczeństwie i zgodności z regulacjami.
Jeśli rozwijasz projekty AI w obszarze health tech lub vet tech, warto już teraz myśleć o:
- współpracy z uczelniami weterynaryjnymi i klinikami w Polsce;
- solidnym prompt engineering i testach z udziałem praktyków;
- modelach biznesowych, które uwzględniają koszty API, odpowiedzialność prawną i potrzebę ciągłego audytu jakości.
Historia Sassy to dobry „wake-up call”: LLM nie są już tylko narzędziem do generowania kodu czy tekstów marketingowych. To potencjalny element krytycznej infrastruktury medycznej – a więc i jedno z najpoważniejszych pól, na których branża AI będzie rozliczana z realnych, a nie deklarowanych kompetencji.
Co sądzisz o tej technologii? Podziel się w komentarzach.

