- Google Deepmind: Genie 3 (genererer tredimensionelle verdener)
- ElevenLabs: Eleven Music
- Anthropic: Claude Opus 4.1
- OpenAI: gpt-oss (gratis open-source model) + GPT-5 pr. 7/8
Og så kom GPT-5: https://openai.com/gpt-5/
Og Qwen-Image, der udkom i går eller forgårs. Endnu bedre prompt adherance end Flux.1 Dev og Wan 2.2 åbenbart.
Ja, det virker til, der er ret hård konkurrence.
Og når der endelig ser ud til at være nogenlunde stabilitet i feltet, og man kan nå at danne sig en fornemmelse af hvilke modeller, der kan hvad, så bliver det hele bare vendt på hovedet på én og samme uge.
Genie 3: Et fremskridt mod tekst-til-virtuelle-verdener.
Eleven Music: Udmærkede demo lydklip i deres blogindlæg. Selv påstår de, at de slår deres konkurrenter - som bl.a. tæller Suno, Udio, Producer.ai (tidl. Riffusion). Opdateret: Har testet den på dansk, og det var ikke overbevisende - den ny Suno v4.5+ er bedre.
Claude Opus 4.1: Har selv kodet en del med Opus 4.0, som er vældigt dyr, så det er en kærkommen opgradering. Den skulle efter sigende være bedre til at håndtere projekter med flere filer, som jo gælder de fleste kodeprojekter.
gpt-oss: To reasoning-modeller - og den første ægte Apache 2.0 udgivelse, OpenAi har lanceret siden GPT2, hvis jeg husker rigtigt. Angiveligt svarer modellernes ydeevne til hhv. o3‑mini og o4‑mini. Er spændt på hvordan de klarer sig ift. alle de kinesiske modeller, som vælter ud (Deepseek, Qwen 3, etc.)