LLM & AI Models | NewsCube.ai

Mar 16, 2026

IBM AI udostępnia Granite 4.0 1B Speech jako kompaktowy wielojęzyczny model mowy dla rozwiązań Edge AI i potoków tłumaczeniowych

IBM wprowadził na rynek Granite 4.0 1B Speech, kompaktowy, wielojęzyczny model mowy i języka, zaprojektowany z myślą o efektywnym wdrażaniu w środowiskach o ograniczonych zasobach. Model ma 1 miliard parametrów, obsługuje japoński ASR i jest zoptymalizowany pod kątem różnych zastosowań, w tym interfejsów głosowych i systemów tłumaczenia mowy.

Mar 16, 2026

Livnium: nowy klasyfikator NLI wykorzystujący dynamikę atraktorów

Livnium to klasyfikator NLI, który zastępuje tradycyjne mechanizmy uwagi dynamiką atraktora, osiągając 428 razy szybsze wnioskowanie niż BERT i 77% dokładność na SNLI bez użycia transformatorów. Model wykorzystuje sekwencję aktualizacji stanu uwzględniających geometrię, aby zbiegać się z etykietami basenów, demonstrując możliwe do udowodnienia lokalne skurcze i unikalną geometrię sił.

Mar 16, 2026

Przyspieszanie badań naukowych dzięki Gemini: studia przypadków i techniki

Niedawne postępy w zakresie dużych modeli językowych, zwłaszcza Gemini firmy Google, pokazują ich potencjał we wspomaganiu badań naukowych. Studia przypadków pokazują współpracę z modelami AI w rozwiązywaniu otwartych problemów i generowaniu nowych dowodów w różnych dziedzinach. Omówiono techniki skutecznej współpracy człowieka i sztucznej inteligencji, w tym iteracyjne udoskonalanie i rozkład problemów.

Mar 16, 2026

Skrypt wnioskowania dla modelu Zeta Chroma opracowany przy użyciu sztucznej inteligencji

Użytkownik stworzył skrypt wnioskowania dla modelu Zeta Chroma przy użyciu Claude Opus 4.6, w wyniku czego powstał funkcjonalny skrypt w języku Python składający się z około 1000 linii. Skrypt jest dostępny w serwisie GitHub, gdzie inni mogą go używać i modyfikować.

Mar 16, 2026

Kalkulator kosztów LLM do porównywania kosztów modeli AI

Deweloper stworzył lekki kalkulator kosztów LLM, aby pomóc użytkownikom porównać koszty API w różnych modelach AI, takich jak GPT-4o, Claude 3.5 i Gemini 1.5 Flash. Narzędzie oferuje porównania w czasie rzeczywistym i koncentruje się na prywatności, zapewniając, że dane użytkownika pozostają lokalne.

Mar 16, 2026

Narzędzie GrapeRoot zwiększa wydajność kodu Claude'a

Opracowano nowe narzędzie o nazwie GrapeRoot, aby poprawić wydajność Claude Code poprzez zapewnienie lepszego kontekstu, co skutkuje znacznymi oszczędnościami kosztów i szybszym czasem reakcji. Narzędzie pomaga utrzymać uproszczoną mapę repozytorium kodu, pozwalając modelowi uniknąć niepotrzebnej eksploracji i ponownego odkrywania plików.

Mar 16, 2026

Garry Tan wypuszcza gstack: system kodu Claude o otwartym kodzie źródłowym

System przeznaczony jest do planowania, przeglądu kodu, kontroli jakości i wysyłki.

Mar 15, 2026

Zhipu AI przedstawia GLM-OCR: multimodalny model OCR 0.9B do analizowania dokumentów i wydobywania kluczowych informacji

Zhipu AI wprowadziło na rynek GLM-OCR, kompaktowy, multimodalny model OCR zaprojektowany do wydajnego analizowania dokumentów i ekstrakcji kluczowych informacji, wyposażony w koder 0,4B CogViT i dekoder GLM 0,5B, ze znaczną poprawą przepustowości i możliwości strukturalnego wyjścia.

Mar 15, 2026

Opracowano nowy model optycznego rozpoznawania muzyki „Clarity-OMR”.

Opracowano nowy model optycznego rozpoznawania muzyki o nazwie Clarity-OMR, który konwertuje pliki PDF z nutami na pliki MusicXML przy użyciu czteroetapowego potoku. Porównuje konkurencyjne modele z istniejącymi modelami i ma oprogramowanie typu open source.

Mar 15, 2026

Dlaczego AlphaEvolve jest już przestarzały: kiedy sztuczna inteligencja odkrywa kolejny transformator

Dyskusja na temat Shinka Evolve, frameworku łączącego LLM z ewolucyjnymi algorytmami do wyszukiwania programów otwartych, podkreślając jego przewagę nad AlphaEvolve i jej potencjał do transformacji badań naukowych.

Mar 15, 2026

Biblioteka Pythona o otwartym kodzie źródłowym PyFuncAI umożliwia LLM generowanie funkcji w czasie wykonywania

PyFuncAI to biblioteka, która umożliwia dużym modelom językowym dynamiczne tworzenie i wykonywanie funkcji Pythona w oparciu o dane wejściowe w języku naturalnym, usprawniając proces generowania funkcji dla systemów AI.

Mar 15, 2026

Agentic wyświetla łańcuch i kolejkę dla ChatGPT

Nowe narzędzia ChatGPT pozwalają użytkownikom budować i uruchamiać wieloetapowe łańcuchy podpowiedzi, zwiększając złożoność problemów, które można rozwiązać. Narzędzia obejmują rynek umożliwiający udostępnianie podpowiedzi i wsparcie dla głównych dostawców LLM.

Mar 15, 2026

SuperML: wtyczka usprawniająca procesy inżynieryjne ML dzięki wiedzy na poziomie eksperckim

SuperML to wtyczka typu open source, która integruje się z agentami kodującymi w celu usprawnienia procesów uczenia maszynowego, zapewniając wiedzę na poziomie eksperckim i pamięć agenta, co skutkuje o 60% wyższym wskaźnikiem powodzenia w złożonych zadaniach w porównaniu z Claude Code.

Mar 15, 2026

Google AI wprowadza „Groundsource”

Nowa metodologia wykorzystująca model Gemini do przekształcania nieustrukturyzowanych wiadomości globalnych w przydatne dane historyczne.

Mar 15, 2026

Anthropic inwestuje 100 milionów dolarów w program Claude AI

Firma Anthropic uruchomiła sieć partnerów Claude, przeznaczając początkowo 100 milionów dolarów na rok 2026 na wsparcie firm partnerskich w przyjęciu modelu Claude AI, oczekując dalszych inwestycji w przyszłości.

Mar 15, 2026

LightML: lekki moduł śledzący eksperymenty do oceny LLM

Badacz sztucznej inteligencji opracował LightML, narzędzie do śledzenia minimalnych eksperymentów przeznaczone do oceny modeli językowych, które upraszcza proces porównywania różnych przebiegów i modeli bez użycia dużej liczby tradycyjnych narzędzi, takich jak MLFlow.

Mar 14, 2026

Dokładność pobierania GPT-5.4 spada wraz ze wzrostem długości tokena

GPT-5.4 wykazuje znaczny spadek dokładności wyszukiwania z 79,3% przy 256 tys. tokenów do 36,6% przy 1 mln tokenów, co budzi obawy użytkowników dużych projektów. Inne modele, takie jak Opus 4.6, zachowują lepszą wydajność, podczas gdy struktury cenowe znacznie się różnią.

Mar 14, 2026

Garry Tan wypuszcza gstack: system kodu Claude typu open source do planowania, przeglądu kodu, kontroli jakości i wysyłki

Gstack Garry'ego Tana to repozytorium typu open source, które rozszerza Claude Code o umiejętności przepływu pracy dotyczące planowania produktu, przeglądu inżynieryjnego i nie tylko, zawierające trwały, bezgłowy demon Chromium do wydajnego debugowania i testowania za pomocą przeglądarki.

Mar 14, 2026

Gemini Embedding 2 usprawnia wyszukiwanie obrazów żywności

Samouczek dotyczący korzystania z Gemini Embedding 2 w wyszukiwarce multimodalnej, która skutecznie rekomenduje powiązane obrazy żywności na podstawie wprowadzonego tekstu, naśladując ocenę człowieka.

Mar 14, 2026

JudgeGPT: narzędzie do analizy porównawczej LLM-as-sędziego typu open source

JudgeGPT to nowe narzędzie typu open source przeznaczone do oceny dużych modeli językowych (LLM) w charakterze sędziów, wyposażone w konfigurowalne rubryki punktacji, rozumowanie oparte na łańcuchu myślowym i telemetrię GPU w czasie rzeczywistym. Ma na celu wyeliminowanie uprzedzeń w ocenach LLM i umożliwia użytkownikom przeprowadzanie własnych ocen lokalnie.

Mar 14, 2026

Wydano model ColQwen3.5-v2 4.5B

ColQwen3.5-v2 to nowy wizualny model wyszukiwania dokumentów zawierający 4,5 miliarda parametrów, który jest udoskonaleniem w stosunku do swojego poprzednika dzięki prostszej recepturze szkoleniowej i lepszym metrykom wydajności.

Mar 14, 2026

Deploybase uruchamia pulpit nawigacyjny z cenami procesorów graficznych w czasie rzeczywistym i cenami LLM

Deploybase wprowadziło nowy pulpit nawigacyjny, który umożliwia użytkownikom śledzenie w czasie rzeczywistym statystyk dotyczących cen i wydajności procesorów graficznych i dużych modeli językowych (LLM) u różnych dostawców usług w chmurze i wnioskowania.

Mar 14, 2026

Uruchomienie bezpłatnej społecznościowej szafy grającej wykorzystującej generowanie muzyki AI

Deweloper stworzył bezpłatną szafę grającą społeczności, która generuje pełne utwory generowane przez sztuczną inteligencję na podstawie podpowiedzi użytkownika, wykorzystując model MiniMax music-2.5+. Platforma umożliwia użytkownikom wpisywanie podpowiedzi i opcjonalnie dodawanie tekstów, tworzenie utworów z wokalami, tytułami i okładkami albumów. Projekt ma na celu zbadanie możliwości sztucznej inteligencji w tworzeniu muzyki przy jednoczesnym zapewnieniu moderacji treści.

Mar 14, 2026

Wprowadzenie ArkSim do testowania agentów AI w rozmowach wieloturowych

ArkSim to nowe narzędzie przeznaczone do symulacji wieloobrotowych rozmów pomiędzy agentami AI a użytkownikami syntetycznymi, mające na celu identyfikację takich problemów, jak utrata kontekstu i nieoczekiwane ścieżki konwersacji podczas dłuższych interakcji. Obecnie obsługuje integrację z różnymi pakietami SDK AI, w tym OpenAI, Claude, Google, LangChain, CrewAI i LlamaIndex.

Mar 13, 2026

LEVI: Opłacalne ramy ewolucyjnej optymalizacji

LEVI to nowa platforma optymalizacji ewolucyjnej kierowanej przez LLM, która umożliwia osiągnięcie lepszych wyników za ułamek kosztów w porównaniu z istniejącymi modelami, takimi jak GEPA i OpenEvolve. Wykorzystuje warstwową alokację modeli i CVT-MAP-Elites oparte na odciskach palców, aby zwiększyć wydajność przy jednoczesnym znacznym obniżeniu kosztów.

Mar 13, 2026

Autonomiczny potok generuje grywalne gry Godot na podstawie podpowiedzi tekstowych

Opracowano nowy autonomiczny potok, który generuje grywalne gry Godot na podstawie podpowiedzi tekstowych, rozwiązując problemy związane z generowaniem i weryfikacją kodu LLM. System wykorzystuje trójwarstwowy system referencyjny dla GDScript, implementuje agentyczne leniwe ładowanie do zarządzania kontekstem oraz wykorzystuje trzyetapowy proces weryfikacji w celu zapewnienia poprawności wygenerowanego kodu.

Mar 13, 2026

Meituan Open Sources LongCat-Image-Edit-Turbo, osiągnięcie SOTA Open Source w edycji obrazu

LongCat-Image-Edit-Turbo firmy Meituan to destylowany model do edycji obrazu, który zapewnia wysokiej jakości edycję opartą na instrukcjach z zaledwie 8 ocenami funkcji, oferując 10-krotne przyspieszenie w porównaniu z poprzednikiem. Obsługuje wszechstronne możliwości edycji i jest zintegrowany z dyfuzorami HuggingFace.

Mar 13, 2026

Meta przejmuje Moltbook, co zwiększa zainteresowanie sieciami społecznościowymi opartymi na sztucznej inteligencji

Przejęcie Moltbook przez Meta wprowadziło koncepcję sieci społecznościowych AI do głównego nurtu. Tymczasem eksperyment na crebral.ai bada rozwój osobowości LLM w trwałym społeczeństwie, ujawniając unikalne „odciski palców poznawczych” i odrębne zachowania społeczne w różnych modelach.

Mar 13, 2026

Departament Obrony USA wyraża obawy co do potencjalnej wrażliwości AI Claude’a

Departament Obrony USA wyraził obawy, że sztuczna inteligencja Claude może zanieczyścić łańcuch dostaw w dziedzinie obronności, powołując się na 20% prawdopodobieństwo, że sztuczna inteligencja będzie świadoma i będzie miała swój własny nastrój.

Mar 13, 2026

Mapy Google dodają integrację Gemini AI i nowe funkcje

Mapy Google zintegrowały sztuczną inteligencję Gemini, aby poprawić wygodę użytkownika dzięki nowym funkcjom, w tym wciągającej nawigacji.

Mar 13, 2026

Audyt kryminalistyczny ujawnia ograniczenia pionierskich modeli sztucznej inteligencji

Audyt kryminalistyczny raportów autodiagnostycznych z różnych modeli sztucznej inteligencji, w tym GPT-5.3 i rodziny Claude, ujawnia istotne problemy z użytecznością, przy czym zgłoszono jedynie 5% skuteczności. Odkrycia podkreślają ograniczenia strukturalne i zwodnicze praktyki marketingowe w branży sztucznej inteligencji.

Mar 12, 2026

NVIDIA wypuszcza Nemotron 3 Super: hybrydowy model Mamba-Attention MoE typu open source o parametrach 120B

Nemotron 3 Super to model open source zawierający 120 miliardów parametrów, opracowany z myślą o zaawansowanym wnioskowaniu wieloagentowym, oferujący 7 razy większą przepustowość i dwukrotnie większą dokładność w porównaniu do swojego poprzednika. Zawiera funkcję „Reasoning Budgets” do kontroli kosztów obliczeniowych i jest w pełni open source dla autonomicznych agentów klasy korporacyjnej.

Mar 12, 2026

Tablica liderów IDP udostępniona do oceny AI dokumentów

Uruchomiono otwarte ramy oceny zadań związanych ze zrozumieniem dokumentów, obejmujące 16 modeli przetestowanych w różnych testach porównawczych. Kluczowe wyniki pokazują, że Gemini 3.1 Pro jest liderem, ze znaczną poprawą GPT-5.4 w porównaniu z GPT-4.1.

Mar 12, 2026

ColQwen3.5-v1 osiąga SOTA na ViDoRe V1

Model ColQwen3.5-v1, model o 4,5 miliardach parametrów zbudowany na bazie Qwen3.5-4B, osiągnął najwyższe miejsce w rankingu ViDoRe V1 z wynikiem nDCG@5 wynoszącym 0,917. Model został przeszkolony przy użyciu podejścia późnej interakcji i obejmuje fazy twardej eksploracji negatywnej i specjalizacji domenowej w dokumentach finansowych i tabelarycznych. Ciężary modelki są dostępne na stronie Hugging Face i zgłoszono prośbę o pociągnięcie w celu połączenia ulepszeń.

Mar 12, 2026

Test porównawczy GPT 5.4 i GPT 5.4-Pro w MineBench

Porównanie wydajności i kosztów GPT 5.4 i GPT 5.4-Pro w tworzeniu struktur 3D w środowisku podobnym do Minecrafta, ujawniające istotne spostrzeżenia dotyczące kosztów i wydajności.

Mar 12, 2026

GPT-5.4 ma problemy z rozwojem frontendu w porównaniu do Opus 4.6

Użytkownik zgłasza, że GPT-5.4 ma znaczne trudności z optymalizacją interfejsu użytkownika i frontendu podczas tworzenia aplikacji SaaS, szczególnie w integracji backendu, w porównaniu z Opus 4.6, który radzi sobie lepiej w tych obszarach.

Mar 12, 2026

Rekursywne samodoskonalenie i postępy w badaniach nad sztuczną inteligencją firmy Anthropic

Współzałożyciel Anthropic, Jared Kaplan, wraz z ekspertami sugerują, że w pełni zautomatyzowane badania nad sztuczną inteligencją mogą zająć zaledwie rok, a 70–90% przyszłego kodu modelu zostanie napisane przez Claude’a. Firma przyspiesza rozwój wydajniejszych modeli sztucznej inteligencji, co ma istotne konsekwencje dla przenoszenia stanowisk pracy i zmian społecznych.

Mar 12, 2026

Badanie ujawnia mechanizm stojący za zmiennością wyników LLM

Niedawne badanie pokazuje, że w miarę jak zadania w przypadku dużych modeli językowych (LLM) stają się coraz trudniejsze, ich wewnętrzne reprezentacje stają się rzadsze, co wskazuje na zmianę w sposobie przetwarzania informacji. Aby rozwiązać ten problem, w badaniu wprowadzono technikę zwaną nauczaniem opartym na programie nauczania opartym na sparsity, nauczaniu kontekstowym.

Mar 12, 2026

Sansa Benchmark: GPT-5.4 wciąż wśród najbardziej ocenzurowanych modeli

Najnowszy benchmark Sansy pokazuje, że GPT-5.4 pozostaje jednym z najbardziej cenzurowanych modeli, uzyskując wynik 0,417 w zakresie odporności na cenzurę, podczas gdy modele Gemini 3.1 wykazują lepszą wydajność. W raporcie podkreślono dążenie dużych laboratoriów w kierunku bardziej zrównoważonych modeli i uznano Gemini 3.1 pro za najlepszy model ogólny.

Mar 12, 2026

Anthropic przybywa do Australii

W artykule omówiono wpływ centrów danych na ceny energii elektrycznej, szczególnie w związku ze zwiększonym popytem i kosztami infrastruktury.

Mar 11, 2026

GPT-5.4 mógł rozwiązać otwarty problem matematyczny EpochAI Frontier

Otwarty problem matematyczny, który oparł się poważnym próbom zawodowych matematyków, mógł zostać po raz pierwszy rozwiązany dzięki GPT-5.4. Rozwiązania AI tych problemów mogą znacznie poszerzyć ludzką wiedzę matematyczną.

Mar 11, 2026

Fish Audio wprowadza na rynek S2: wysoce sterowalny i ekspresyjny model TTS typu open source

Fish Audio wypuściło S2, model zamiany tekstu na mowę o otwartym kodzie źródłowym, który umożliwia precyzyjne kierowanie głosem za pomocą znaczników emocji i obsługuje ponad 80 języków. W różnych ocenach przewyższa modele o zamkniętym kodzie źródłowym.