Die besten KI-Tools: Chatbots, Bilder & Video

In diesem Artikel möchte ich die – aus meiner Sicht – besten KI-Tools mit Euch teilen.

Auch wenn viele Tools kostenlos verfügbar sind, empfehle ich jedem bezahlte Accounts für ChatGPT PLUS oder Claude Pro zu buchen. Denn nur dort bekommt man Zugriff auf die leistungsstärksten KI-Modelle , die sich auch kommerziell und ohne künstliche Einschränkungen nutzen lassen.

Die datenschutzkonforme Alternative ist Le Chat von Mistral AI aus Frankreich.

Es folgt eine Übersicht aller KI-Tools, die Du Dir anschauen solltest.

Hinweis: Durch die dynamische Entwicklung im Bereich generativer KI, kann sich die Liste der Tools täglich verändern.

KI-Chatbots & Suchen

KI-Chatbots und große Sprachmodelle sind dank des gigantischen Erfolges von ChatGPT in aller Munde. Es existiert mittlerweile eine vielzahl unterschiedlicher Modelle und Anbieter, die sich in Qualität, Zuverlässigkeit und Funktionen zum Teil jedoch noch erheblich unterscheiden.

1) 🇺🇸 Anthropics Claude

Claude ist die derzeit leistungsfähigste Chatbot-KI, die von Anthropic entwickelt wurde und hat ChatGPT für mich mittlerweile für viele Workflows abgelöst. Sie kann bei einer Vielzahl von Aufgaben assistieren, wie zum Beispiel beim Verfassen von Texten, bei der Durchführung von Analysen, beim Beantworten von Fragen, bei mathematischen Berechnungen, beim Programmieren von Code und mehr.

Das derzeitige Spitzenmodell „Claude 3.5“ legt die Messlatte für Intelligenz höher und übertrifft derzeit alle Modelle der Mitbewerber! Claude 3.5 Sonnet ist ab sofort kostenlos auf Claude.ai und in der Claude iOS App verfügbar, während Abonnenten der Claude Pro und Team Pläne mit höheren Nutzungslimits zugreifen können.

Besonders hilfreich finde ich die Integration der sogenannten Artefakte, quasi in sich abgeschlossene Inhalte, die Claude in einem eigenen Fenster anzeigt, das von der Hauptkonversation getrennt ist. Artefakte erleichtern insbesondere die Arbeit mit wichtigen Inhalten, die du vielleicht später ändern, erweitern oder referenzieren möchtest, wie zum Beispiel HTML-Code oder Artikel im Markdown-Format. Aber auch Skalierbare Vektorgrafiken (SVG), Diagramme und Flussdiagramme und sogar Interaktive React-Komponenten können direkt dargestellt und sogar separat geteilt werden.

Claude kann in seinem neuen Analysetool nun auch Code schreiben und ausführen. Das Tool hilft Claude, mathematisch präzise und reproduzierbare Antworten zu geben. Mit Artifacts lassen sich daraus dann interaktive Datenvisualisierungen erstellen.

Es ist natürlich auch über Anthropics API, Amazon Bedrock und sogar Google Cloud’s Vertex AI verfügbar. Das Modell kostet $3 pro Million Input-Token und $15 pro Million Output-Token, mit einem Kontextfenster von 200K Token.

Erst kürzlich wurde eine bahnbrechende neue Funktion in der öffentlichen Beta-Version eingeführt, die Computernutzung. Entwickler können Claude über die API anweisen, Computer so zu benutzen, wie Menschen es tun – indem sie auf einen Bildschirm schauen, einen Cursor bewegen, auf Schaltflächen klicken und Text eingeben. Claude 3.5 Sonnet ist das erste KI-Modell, das Computernutzung in der öffentlichen Beta-Version anbietet. In dieser Phase ist es noch experimentell – manchmal umständlich und fehleranfällig.

Nutzungsbedingungen: https://console.anthropic.com/legal/terms
Datenschutz: https://console.anthropic.com/legal/privacy

2) 🇺🇸 ChatGPT von OpenAI

ChatGPT Free: Dies ist eine kostenlose Forschungsvorschau von OpenAI und kann nach einer Registrierung kostenlos verwendet werden. Nach der Registrierung erhält man Zugang zu GPT-3.5 sowie eingeschränkten Zugang zu GPT-4o und erweiterten Datenanalysen, Datei-Uploads, Vision, Web-Browsing und benutzerdefinierten GPTs (Nur Nutzen, nicht Erstellen).

Die Datenspeicherung und Nutzung zum Training weiterer Modelle kann hier nicht deaktiviert werden!

Es gelten die allgemeinen Nutzungsbedingungen für Nutzer:innen in Europa https://openai.com/de-DE/policies/eu-terms-of-use/
ChatGPT PLUS: Die Bezahlversion (20 USD pro Monat) bietet Zugriff auf GPT-4o, o1-preview, Browsing via Bing, Bildgenerierung via DALL-E 3 sowie Datenupload, -analyse und die Erstellung eigener ChatBots (GPTs).

Die Nutzung erfolgt unter den erweiterten Bedingungen für Business Accounts: https://openai.com/policies/business-terms.

Die Speicherung von Chatverläufen kann deaktiviert werden. Eine Nutzung der Daten zu Trainingszwecken seitens OpenAI findet nicht statt. Dennoch werden alle eingegebenen oder hochgeladenen Daten zu Servern von OpenAI transferiert und das kalifornische Recht findet Anwendung.
ChatGPT Teams: Erweiterte Nutzung von GPT-4 (Mehr Anfragen + 128k Token Window), mehr Ressourcen für Codeausführung und Datenanalyse, sowie GPTs in eigenem Workspace teilen. Ab 50$ im Monat (Mind. 2 Accounts zu je 25$/Monat). Teamdaten sind standardmäßig vom Training ausgeschlossen. Inkl. Admin-Konsole für die Verwaltung des Arbeitsbereichs
GPT-4o via API: Das Sprachmodell GPT-4o lässt sich via API nutzen, beispielsweise im Playground: https://platform.openai.com/playground?mode=chat&model=gpt-4o. Die Abrechnung findet hierbei je Token statt, je nachdem welches Modell verwendet wird: https://openai.com/pricing

Hier kommen die erweiterten Enterprise Privacy Terms zum Einsatz: https://openai.com/enterprise-privacy

3) 🇺🇸 Microsoft Copilot

Mit einem kostenlosen Konto von Microsoft können Sie unter Bing AI – Suchen direkt auf den KI-basierten Copilot zugreifen. Zusätzlich hat Microsofts mit “Copilot” einen eigenen KI-Chatbot veröffentlicht, der über die integrierte Suchfunktion relevantere Ergebnisse liefert. Bings Copilot überprüft dabei Ergebnisse aus dem gesamten Web, um die gesuchte Antwort zu finden und diese mittels GPT-4 zusammenzufassen.

Dieser Chatbot kann auch Bilder und via Plugins wie Suno sogar Musik generieren. Aktivieren Sie maximal 3 Plug-Ins gleichzeitig, um Restaurantreservierungen, Flüge und vieles mehr direkt im Copiloten zu nutzen.

Die Nutzung erfolgt nach folgenden Bedingungen: https://www.bing.com/new/termsofuse

4) 🇺🇸 Perplexity AI

Perplexity AI fungiert als extrem leistungsfähige Suchmaschine, die das Internet durchsucht, um eine Antwort zu geben, wenn ein Nutzer eine Frage eingibt. Sie kann auch Vorschläge und Quellen als Antwort auf Anfragen liefern. Sie wurde entwickelt, um das Internet in Echtzeit zu durchsuchen und aktuelle Informationen zu verschiedenen Themen bereitzustellen.

Perplexity Quick Search (kostenlos) ist ein Chatbot und eine Suchmaschine, die große Sprachmodelle verwendet, um präzise Antworten auf Fragen zu geben.
Perplexity Pro ($20 im Monat) erlaubt es zwischen den Modellen zu wählen und unbegrenzt Dateien hochladen und analysieren.

Außerdem erhält man unbegrenzte Schnellsuchen und 600 Pro-Suchen pro Tag bei Perplexity Copilot, einem interaktiven Recherche-Assistenten für eine gründliche Recherche bei komplexen Anfragen mit genaueren Antworten. 50 Antworten pro Tag lassen sich mit Playground AI, DALL-E, SDXL und mehr visualisieren.

Es gelten folgende Nutzungsbedingungen: https://blog.perplexity.ai/legal/terms-of-service
Datenschutzerklärung unter: https://blog.perplexity.ai/legal/privacy-policy

5) 🇺🇸 Google Gemini

Googles Chatbot Gemini lässt sich mit einem Google Account kostenlos nutzen. Mittels Erweiterungen lässt sich auf auf Informationen aus Quellen wie Google Maps, YouTube, Google Flüge und Hotels auf Google zugreifen.

Außerdem gibt es eine Erweiterung für Google Workspace, also Gmail, Google Docs, Google Drive und Co. Damit lassen sich Inhalte zusammen fassen und nach Informationen in deinen Dokumenten suchen.

Datenschutz von Gemini: https://support.google.com/a/answer/14130944?hl=de#zippy=%2Cwie-sch%C3%BCtzt-gemini-meine-daten

6) 🇪🇺 Mistral Le Chat

Als einziges Europäisches Unternehmen positioniert sich das Pariser Start-up Mistral AI als datenschutzkonforme Alternative zu den OpenAI und Anthropic mit der Einführung eines eigenen Chatbots namens Le Chat. Dort erhält man Zugriff auf das leistungsstärkste Modell namens Large, das – anders als die kleineren Modelle – leider nicht mehr als Open Source veröffentlicht wurde. Es gibt mobile iOS- und Android-Apps sowie von ChatGPT bekannte Funktionen wie Websuche, Dokumentenverarbeitung, Code-Interpreter und eine Bilderzeugung, die auf dem Flux-Ultra-Modell von Black Forest Labs basieren.

Besonders ist die Funktion namens „Flash Answers“, die Antworten mit einer Geschwindigkeit verarbeitet, die die von Konkurrenzprodukten wie ChatGPT und Claude um das Zehnfache übersteigt!

Mit einem Kontextfenster von 32.000 Token unterstützt Mistral Large die Sprachen Englisch, Französisch, Spanisch, Deutsch und Italienisch. Neben einem europäischen Datenschutz bietet Mistral AI sogar eine Vereinbarung zur Datenverarbeitung und erfüllt damit als einziger Chatbot die Anforderungen der DSGVO bzw. TTDSG!

Natürlich gibt es einen kostenlosen Plan, sowie eine Pro-Stufe für 14,99 $/Monat, eine Team-Stufe für 24,99 $/Benutzer/Monat und eine Enterprise-Option mit benutzerdefinierter Bereitstellung.

Es gelten folgende Nutzungsbedingungen: https://mistral.ai/terms/#terms-of-use

7) 🇺🇸 Ecosia Chat

Die deutsche Suchmaschine Ecosia bietet auf Basis von OpenAI ebenfalls einen Chatbot mit Fokus auf Datenschutz innerhalb seiner Suche an. Die Nutzeranfragen werden im Hintergrund jedoch an OpenAI weitergeleitet. Diese Daten werden jedoch nicht dazu verwendet, das Modell von OpenAI zu trainieren. Laut Ecosia werden aber zumindest keine persönlichen Daten wie IP-Adresse und Standort des Nutzers an OpenAI weitergeleitet. Achtung: Alle Informationen, die man im Chat teilt, werden an OpenAI gesendet!

Es gelten folgende Nutzungsbedingungen: https://www.ecosia.org/privacy

8) 🇺🇸 You.com Chat

Die Suchmaschine You.com bietet einen kostenlosen Chatbot innerhalb seiner Suche auf Basis eines eigenen Sprachmodells an. Nach kostenloser Registrierung steht der Smart Assistant unbegrenzt zur Verfügung. Damit lassen sich Inhalte generieren, kreatives Schreiben üben, sowie Nachrichten & Live-Web-Ergebnisse abrufen.

Für $15 im Monat hat man, ähnlich wie bei perplexity unbegrenzt Zugriff auf GPT-4, Claude 3 Opus, Gemini 1.5 Pro, Llama 3, Dolphin 2.5 (unzensiert), den Genius-Assistent zur Lösung für komplexe, mehrstufige Probleme, den Recherche-Assistent für Analysen und Vergleiche mit umfangreichen Zitaten sowie den Kreativ-Assistent, um Ideen in Bildmaterial zu verwandeln. Außerdem sind unbegrenzte Datei-Uploads (PDFs, Bilder, Texte und mehr) möglich.

Es gelten folgende Nutzungsbedingungen: https://you.com/legal/terms

9) 🛡️ Chatbots auf dem eigenen PC / Mac (offline)

Mit LM Studio lassen sich freie LLMs wie Llama 2, Code Llama oder Mistral / Mixtral auf Mac, Windows und Linux installieren und nach dem Download sogar ohne Internetverbindung lokal nutzen. Modelle können über die In-App-Chat-Oberfläche oder einen OpenAI-kompatiblen lokalen Server via API offline genutzt werden.

Die Modelle unterliegen unterschiedlichen (zum Teil echten) Open Source Lizenzen, sind jedoch ihrer Präzision reduziert (4, 6, 7 oder 8-bit quantisiert) und damit in der Leistungsfähigkeit eingeschränkt. Für eine schnelle Textgenerierung ist leistungsstarke Hardware notwendig (M1, M2 oder GPUs mit viel Video-RAM). Beachte: Kein freies Sprachmodell ist so leistungsfähig wie die kommerziellen Top-Modelle GPT-4(o), Gemini 1.5 Pro oder Claude 3 Opus.

LM Studio wird von Element Labs, Inc. angeboten. Es gelten folgende Nutzungsbedingungen: https://lmstudio.ai/terms

Bilder KI Tools

Text-To-Image Modelle haben sich in den letzten 24 Monaten rasant entwickelt. Aktuelle Spitzenmodelle erlauben es, beliebige Bilder von Strichzeichnungen über klassische Gemälde und Comics bis hin zu fotorealistischen Motiven mittels einfacher Beschreibung in Textform zu generieren.

1) 🇺🇸 midjourney

Midjourney ist ein Programm und Dienst für generative künstliche Intelligenz, der vom unabhängigen Forschungslabor Midjourney, Inc. in San Francisco entwickelt und betrieben wird. Midjourney generiert Bilder aus natürlichsprachlichen Beschreibungen, sogenannten Prompts.

Die kostenlose Generierung nur über Discord und öffentlich möglich. Zum Teil lange Wartezeit.
Kommerzielle Nutzung: 200 Bilder für $10/Monat bzw. Unlimitierte Nutzung ab $30/Monat.

Es gelten folgende Nutzungsbedingungen: https://docs.midjourney.com/docs/terms-of-service
Datenschutzbestimmungen: https://docs.midjourney.com/docs/privacy-policy

2) 🇺🇸 Ideogram

Ideogram AI ist ein weiterer Text-zu-Bild-Generator, mit dem man Bilder mittels Anweisungen erstellen kann. Ideogram ist besonders gut geeignet, um (kurze) Texte in KI-Bildern zu rendern. Umfangreichere Texte werden auch hier leider noch nicht unterstützt. Tipp: 20 öffentliche Bilder / Tag sind in komprimierter JPG Qualität kostenlos. Außerdem lassen sich Bilder in Text umwandeln mit „Describe“ und man hat Zugang zur öffentlichen Community-Galerie. Für $16 im Monat lassen sich private Bilder generieren und man erhält unbegrenzte Generierungen, davon 1.000 ohne Warteschleife pro Monat.

Das neue Ideogram „Canvas“ genannt, ist ein neues Interface für die kreative Gestaltung und Bearbeitung von Bildern. Es bietet quasi eine unendliche digitale Leinwand, auf der Bilder organisiert, generiert, bearbeitet und kombiniert werden können. Nutzer:innen können eigene Bilder hochladen oder neue Inhalte direkt innerhalb von Canvas erstellen. Die nahtlose Bearbeitung erfolgt durch die fortschrittlichen Funktionen Magic Fill (Inpainting) und Extend (Outpainting):

Mit dem Extend Tool lassen sich Bilder über ihre ursprünglichen Grenzen hinaus erweitern, ohne die Stil-Kohärenz zu verlieren. Ideal für Anpassungen an verschiedene Bildschirmgrößen und Bildkompositionen.
Magic Fill ermöglicht das Bearbeiten spezifischer Bildbereiche, um Objekte zu ersetzen, Text hinzuzufügen, Fehler zu korrigieren oder Hintergründe zu ändern. Perfekt für detaillierte Anpassungen und Bildkombinationen.

Es gelten folgende Nutzungsbedingungen: https://ideogram.ai/tos

3) 🇺🇸 Runway ML Text to Image

Jede Text-zu-Bild-Erstellung kostet 5 Credits. Credits können mit einem Standard- oder Pro-Abo für jeweils umgerechnet $.01 erworben werden, wobei der Mindestbetrag $10 beträgt. Für das Herunterladen in höheren Auflösungen ist ein Standard ($12) oder Pro-Konto (ab $28) erforderlich.

Nutzungsbedingungen: https://runwayml.com/terms-of-use/
Datenschutzerklärung: https://runwayml.com/privacy-policy/

4) ⚖️ Adobe Firefly

Adobe hat eigene generative KI Modelle entwickelt und als Einziger Anbieter diese ausschließlich auf Basis lizenzierter Trainingsdaten erstellt. Damit erreicht Adobe eine bislang unerreichte Rechtssicherheit für die Nutzung der erstellten Bilder!

Adobe Firefly wurde in Adobes Creative Suite integriert. Es stehen neben klassischen Funktionen wie Text zu Bild auch generative Füllung innerhalb von Photoshop oder sogar für KI-generierte Vektorgrafiken in Illustrator zur Verfügung.

Mit einem kostenlosen Adobe Account lassen sich 25 Generative Credits pro Monat nutzen. Für 5,49 €/Monat erhält man 100 Generative Credits, Zugriff auf kostenlose Schriften von Adobe Fonts sowie mit Firefly erstellte Bilder ohne Wasserzeichen.

5) 🇺🇸 Magnific AI

KI-generierte Bilder sind in der Regel nicht besonders hoch aufgelöst. Hier hilft ein Upscaler & Enhancer für Bilder. Magnific AI nutzt fortschrittlichste KI-Technologie, die ein hochauflösendes Upscaling ermöglicht und nicht nur hochskalieren, sondern auch verbessern kann. Magnific kann dabei neue Details im Bild halluzinieren, also neu erschaffen – und das nach eigenen Vorgaben und Parametern.

Zusätzlich bietet Magnific eine sehr spannende Funktion namens Relight (aktuell noch in der Beta), die eine neue Szene aus einem Foto erstellt. Dabei wird also die Person, das Produkt oder die Objekte in einer anderen Umgebung, also quasi mit einem neuen KI-generierten Hintergrund ausgestattet. Das Besondere daran ist, dass nicht einfach nur das Objekt freigestellt und der Hintergrund ausgetauscht wird, sondern die Beleuchtung des Objektes und damit auch die Atmosphäre angepasst wird. Dabei wird das Licht extrem realisistisch an die neue Szenerie angepasst.

Kosten: Pro-Plan 39$/Monat, Premium-Plan 99$/Monat und Business-Plan 299$/Monat

Nutzungsbedingungen: https://magnific.ai/legal/
Datenschutz: https://magnific.ai/legal/#privacy

6) 🛡️ Offline Bildgenerierung mit Stable Diffusion

Stable Diffusion wurde von Forschern der CompVis Group an der Ludwig-Maximilians-Universität München und Runway mit einer Rechenspende von Stability AI und Trainingsdaten von gemeinnützigen Organisationen entwickelt.

Die verwendete CreativeML Open RAIL-M Lizenz erlaubt zwar die kostenlose Nutzung, allerdings nur für nicht-kommerzielle Zwecke, also für den persönlichen Gebrauch und die Forschung. Für $20 pro Monat lassen sich die Modelle zur kommerziellen Nutzung lizensieren, müssen jedoch noch selbst gehostet werden.

SD XL kann kostenlos ausprobiert werden unter https://nogpu-webui.com/
Das Modell besitzt jedoch sehr viele Hyper-Parameter, die eine längere Einarbeitungszeit erfordern.

Für die lokale Installation sind allerdings fortgeschrittene Fähigkeiten notwendig:
Mac: https://stable-diffusion-art.com/install-mac/
Windows: https://stable-diffusion-art.com/install-windows/

Audio KI Tools

Der erste große Block im Bereich Audio KI sind sogenannte Speech-To-Text-Modelle. Spracherkennung per Software gibt es zwar bereits seit den 90er Jahren, jedoch erlauben aktuelle Modelle eine nahezu fehlerfreie Transkription in beliebigen Sprachen und können sogar unterschiedliche Sprecher:innen identifizieren und markieren.

Hiermit können Podcast-Transkripte oder Textversionen von Meetings und Interviews erzeugt und mittels großer Sprachmodelle weiterverarbeitet, beispielsweise zusammengefasst oder umgeschrieben werden.

1) 🇺🇸 Whisper von OpenAI

Whisper ist ein automatisches Spracherkennungssystem (ASR), das anhand von 680.000 Stunden mehrsprachiger und multitaskingüberwachter Daten aus dem Internet trainiert wurde und unter MIT Lizenz (Open Source) steht.

Whisper steht unter anderem über die API von OpenAI zur Verfügung und unterstützt folgende Sprachen: Afrikaans, Arabic, Armenian, Azerbaijani, Belarusian, Bosnian, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, Galician, German, Greek, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Italian, Japanese, Kannada, Kazakh, Korean, Latvian, Lithuanian, Macedonian, Malay, Marathi, Maori, Nepali, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tagalog, Tamil, Thai, Turkish, Ukrainian, Urdu, Vietnamese, and Welsh.

Whisper lässt sich als Open Source Modell auch lokal, d.h. offline nutzen!

Mit MacWhisper lassen sich die unter MIT License stehenden, freien Allzweck-Spracherkennungsmodelle von OpenAI mit dem Namen Whisper lokal auf dem Mac herunterladen und offline betreiben. MacWhisper selbst kostet 29$ einmalig.

Eine Installation unter Windows ist möglich, erfordert jedoch umfangreiche technische Fähigkeiten: https://github.com/openai/whisper/discussions/1463

2) 🇺🇸 Runway ML Speech-To-Text

Verwandelt Audiospuren aus Videos oder reine Sprachaufzeichnungen in Text. Liefert exakte und verständliche Transkriptionen.

Nutzungsbedingungen: https://runwayml.com/terms-of-use/
Datenschutzerklärung: https://runwayml.com/privacy-policy/

Der zweite Block stellt Text-To-Speech-Modelle dar, also klassische Sprachsynthese, die wir ebenfalls bereits seit den 90er kennen, nun jedoch in einer Qualität, die wir lange nicht für möglich gehalten haben.

1) 🇺🇸 OpenAI Text-To-Speech

OpenAIs Audio-API bietet mittlerweile auch eine Sprachschnittstelle, die auf deren TTS-Modell (Text-to-Speech) basiert. Sie verfügt über 6 integrierte Stimmen und kann verwendet werden, um Blog-Einträge vorzulesen, gesprochenes Audio in mehreren Sprachen zu produzieren oder Audio in Echtzeit zu generieren.

Hier kommen die erweiterten Enterprise Privacy Terms zum Einsatz: https://openai.com/enterprise-privacy

2) 🇺🇸 Elevenlabs Text-To-Speech

Kostenlose KI-Sprachsynthese von Elevenlabs. Erzeugt lebensechte Sprache in jeder Sprache und Stimme. Kann Sprecher:innen klonen und nachahmen!

Nutzungsbedingungen: https://elevenlabs.io/terms
Datenschutz: https://elevenlabs.io/privacy

3) 🇺🇸 Runway ML Text-To-Speech

Runway Text-to-Speech verwandelt Text in lebensechte, ausdrucksstarke Sprache. Liefert qualitativ hochwertige Voiceovers oder Erzählungen.

Nutzungsbedingungen: https://runwayml.com/terms-of-use/
Datenschutzerklärung: https://runwayml.com/privacy-policy/

4) 🇺🇸 Elevenlabs Video Dubbing

Übersetzt Videos und Sprache in 29 Sprachen in Sekundenschnelle mit Sprachübersetzung, Sprechererkennung und Nachvertonung.

Nutzungsbedingungen: https://elevenlabs.io/terms
Datenschutz: https://elevenlabs.io/privacy

Der dritte Block stellt mit Text-To-Sound & Music einen neuen Anwendungsbereich dar, bei dem Melodien, Rythmen, Töne und Geräusche bis hin zu ganzen Liedern mittels Textanweisungen generiert werden können.

Dieser Bereich ist, ähnlich wie Text-To-Video noch sehr neu und hochdynamisch. Die leistungsstärksten, bereits vorgestellten Modelle stehen derzeit noch nicht zur Verfügung.

Meta AIs neuestes Modell Voicebox steht derzeit leider noch nicht zur Verfügung. Googles MusicFX stehen aktuell nur wenigen ausgewählten Nutzer:innen in den USA über die AI Test Kitchen zur Verfügung. MusicFX basiert auf Googles MusicLM und nutzt die neuartige Wasserzeichen-Technologie von Google DeepMind, SynthID, um ein digitales Wasserzeichen in die Ausgaben einzubetten.

1) 🇺🇸 Suno AI

Suno generiert Musik per KI. Man braucht kein Instrument, nur etwas Fantasie. Auch in Microsoft Copilot als Plugin integriert.

Mit einem kostenlosen Account erhält man 50 Credits/Tag (10 Lieder) zur nicht-kommerziellen Nutzung. Kommerzielle Nutzung ab $8 je Monat.

Nutzungsbedingungen: https://www.suno.ai/terms
Datenschutz: https://www.suno.ai/privacy

Video KI Tools

Text-To-Video Modelle sind ein relativ neues Phänomen und noch in einem sehr frühen, experimentellem Status. Diese Tools eignen sich derzeit noch nicht für den kommerziellen Einsatz. Allerdings sollten Sie sich mit den faszinierenden Möglichkeiten beschäftigen, denn eine Ausweitung der Qualität von Text-To-Image auf Text-To-Video ist nur noch eine Frage der Zeit, wie die Vorstellungen von OpenAIs Sora und Google Deepminds Veo zeigen.

1) 🇺🇸 OpusClip – KI Video Clipping Tool

OpusClip ist ein leistungsstarkes, KI-gestütztes Tool, das dabei hilft, aus langen Videos extrem effizient erfolgreiche Short-Form-Videos für Social-Media-Plattformen wie TikTok, Instagram, LinkedIn und Co. zu erstellen. Es wandelt automatisch lange Videos in virale Clips um und ermöglicht die Veröffentlichung auf allen gängigen Social-Media-Plattformen mit nur einem Klick. Unterstützt werden Video-Links von Plattformen wie YouTube, Google Drive, Vimeo, Zoom, Facebook, LinkedIn und vielen mehr.

Hauptfunktionen und Vorteile:

Auto Reframe: Die KI passt Clips automatisch an verschiedene Seitenverhältnisse an, erkennt dabei Sprecher_innen und bewegte Objekte. Dies sorgt dafür, dass die Videos perfekt für jede Plattform optimiert sind.
AI Curation: OpusClip identifiziert die überzeugendsten Hooks und Highlights in einem Video und arrangiert diese zu einem ansprechenden Kurzvideo. So wird sichergestellt, dass nur die besten Inhalte genutzt werden, um die Aufmerksamkeit der Zuschauer_innen zu fesseln.
Animierte Untertitel: Automatisch generierte, animierte Untertitel mit über 97 % Genauigkeit und zahlreichen anpassbaren Vorlagen sorgen dafür, dass die Clips professionell wirken und besser verstanden werden.
AI B-Roll: Die KI fügt kontextuell relevante B-Roll-Videos hinzu, sei es aus lizenzfreiem Material oder KI-generierten Visuals. Dies steigert die visuelle Attraktivität und Relevanz der Clips.
Brand Templates: Nutzer_innen können verschiedene Markenvorlagen mit individuellen Schriftarten, Farben und Logos erstellen, um ein konsistentes und professionelles Erscheinungsbild zu gewährleisten.
Social Post Scheduler: Durch die Möglichkeit, Clips automatisch auf Plattformen wie YouTube, TikTok, Instagram, Facebook, LinkedIn und X zu posten und zu planen, spart man wertvolle Zeit und kann Inhalte gezielt verbreiten.
Virality Score: Ein KI-basierter Virality Score zeigt das Potenzial eines Clips, viral zu gehen, und hilft so, gezielt die erfolgreichsten Inhalte auszuwählen.
Nahtlose Zusammenarbeit: Mit der Export-Funktion können Videos direkt in Adobe Premiere Pro exportiert werden, und Teams können über einen gemeinsamen Workspace effizient an Projekten zusammenarbeiten.

OpusClip revolutioniert für mich komplett die Erstellung von Short-Form-Videos, indem es den gesamten Prozess automatisiert und optimiert. Das Tool ermöglicht es mir innerhalb von Minuten, aus langem Videomaterial schnell und effizient virale Kurzvideos zu erstellen, die auf Plattformen wie TikTok, Instagram und LinkedIn maximale Reichweite und Engagement erzielen.

Durch die Kombination von KI-gestützter Analyse, automatischer Anpassung und sofortiger Veröffentlichung bietet OpusClip eine erhebliche Zeitersparnis und steigert die Erfolgsquote von Social-Media-Kampagnen. So wird aus jeder Videoaufnahme das volle Potenzial herausgeholt, ohne dass umfangreiche manuelle Bearbeitungen erforderlich sind. Bei kleinen Fehlern im Transkript oder bei der KI-basierten Auswahl der Szenen kann man selbstverständlich manuell Hand anlegen und entsprechend nachsteuern.

Tipp: Hier ist dein Link für 30 % Rabatt auf den ersten Monat eines Pro-Plans: opus.pro/afaik30

2) 🇺🇸 Pika.art

Pika ist eine relativ neue KI-Videoplattform, die es jedem ermöglicht, seine kreative Vision zum Leben zu erwecken. Das Unternehmen bietet vergleichbare Videoerstellungs- und -bearbeitungswerkzeuge wie RunwayML, das aktuell jedoch kostenlos und für jeden zugänglich ist.

Nutzungsbedingungen: https://pika.art/terms-of-service
Datenschutz: https://pika.art/privacy-policy

3) 🇺🇸 Runway ML Text-to-Video Gen3

Gen-3 Alpha wurde für die Generierung von Videos und Bildern trainiert und wird Runways Text-zu-Video-, Bild-zu-Video- und Text-zu-Bild-Werkzeuge, bestehende Steuerungsmodi wie Motion Brush, Advanced Camera Controls, Director Mode sowie zukünftige Werkzeuge für eine noch feinere Kontrolle von Struktur, Stil und Bewegung unterstützen.

Gen-3 Alpha wurde speziell mit sehr detailliert beschreibenden Untertiteln trainiert, die phantasievolle Übergänge und präzises Keyframing von Elementen in der Szene ermöglichen.

Über das Abonnement (ab 12$ im Monat) stehen außerdem Funktionen wie das Hochskalieren von Bildern zur Verfügung.

Nutzungsbedingungen: https://runwayml.com/terms-of-use/
Datenschutzerklärung: https://runwayml.com/privacy-policy/

Produktivitätstools

Neben klassischen Content-Generierungstools und Chatbots gibt es auch immer mehr spezialisierte Anwendungen, die einem im Alltag dabei helfen, bestimmte Aufgaben, schneller und besser zu erledigen.

1) 🇺🇸 Eraser.ai

Es gibt nun auch eine spezialisierte KI-Anwendung für visuelle Darstellungen, die zeigen, wie die einzelnen Systeme zusammenspielen. Denn ein Diagramm von Grund auf zu erstellen, kann viel Zeit und technisches Know-how erfordern.

Mit Eraser gibt es nun einen Kopiloten, der Diagramme mit einfachen Textanweisungen erstellen kann, unabhängig von der technischen Tiefe. Er verfügt über anpassbare Icons und intuitive Bearbeitungswerkzeuge für die Visualisierung von nahezu jedem komplizierten Prozess.

2) 🇺🇸 Napkin.ai

Ein richtig cooles Programm ist Napkin. Das Tool verwandelt Text in eine visuelle Darstellung, also ein Diagramm zur Visualisierung, damit man Ideen schnell und effektiv teilen kann.

Ähnlich wie bei Eraser braucht man keine komplexen Prompts, Napkin arbeitet direkt mit dem vorhandenen Text. Man fügt einfach Text ein, und der Rest geht ganz automatisch. Napkin erstellt automatisch die relevantesten Visualisierungen, du kannst dann diejenige auswählen, die deine Vorstellung am besten widerspiegelt. Die Visualisierungen sind editierbar, sodass du Inhalt und Stil anpassen kannst.