Welche Sprachen unterstützt die Transkription?

Über 100 per Whisper. Pro Aufnahme automatisch erkannt. Auch das Mischen von Sprachen in derselben Aufnahme funktioniert.

Welche Stimmen kann ich wählen?

Im kostenlosen Tarif OpenAI-TTS-Stimmen (Alloy, Echo, Fable, Onyx, Nova, Shimmer). Im kostenpflichtigen der gesamte ElevenLabs-Katalog plus Stimmenklonen aus einer 30-sekündigen Probe.

Funktioniert es freihändig?

Im iOS-Telegram-Client ja – Sprache rein, Sprache raus, kein Tippen. Im Web müssen Sie jeden Zug mit der Leertaste starten (Browser-Sicherheitsbeschränkung).

Wohin geht mein Audio?

Verschlüsselt während der Übertragung, transkribiert auf einer gehosteten Whisper-Instanz, Audio innerhalb von 60 Sekunden gelöscht. Transkripte bleiben in Ihrem Chat-Verlauf (verschlüsselt, aus den Einstellungen löschbar).

Medien & Kreatives

Voice

Nehmen Sie eine Nachricht auf, transkribieren Sie Sprache, hören Sie Ihre KI zurücksprechen.

Sprechen Sie per Stimme mit MoClaw und erhalten Sie eine Sprachantwort. Nehmen Sie auf jeder Chat-Oberfläche eine Nachricht auf, MoClaw transkribiert sie, generiert eine Antwort und liest die Antwort (auf Wunsch) in einer gewählten Stimme vor. Funktioniert in der Web-App, im iOS- und Android-Telegram-Bot und in jeder Slack-DM.

Kostenlos testen Alle Integrationen

So funktioniert es

3 Schritte, um Voice einzubinden — ohne Engineering-Aufwand.

1

Tippen Sie in jedem Chat auf das Mikrofon

Im Web die Leertaste halten. In Telegram eine Sprachnachricht senden. In Slack eine Audiodatei anhängen.
2

MoClaw transkribiert und antwortet

Transkription auf Whisper-Niveau mit Mehrsprachenunterstützung. Die Antwort kommt standardmäßig als Text zurück.
3

Oder lassen Sie es Ihnen vorlesen

Schalten Sie in den Einstellungen 'Sprachantwort' ein, um Audioantworten in einer von Ihnen gewählten Stimme zu erhalten (ElevenLabs, OpenAI TTS oder Systemstimmen).

Probiere zu sagen

Echte Prompts, die du in Voice einfügen kannst.

› Sprachmemo: 'Erinnere mich, bis Mittwoch Geschäftsschluss beim Design-Team wegen der neuen Startseite nachzufassen.'
› Beim Autofahren: 'Lies mir die Schlagzeilen von Hacker News vor, die Top 5.'
› Schick mir das tägliche Morgen-Briefing als 90-sekündige Sprachnachricht statt als Text.

Schritt-für-Schritt-Demo

Was tatsächlich passiert, wenn du den Prompt sendest.

Prompt 01 4 Schritte

“Sprachmemo aus dem Auto: 'Schreib Sarah eine E-Mail, dass wir der Q2-Partnerschaft zustimmen, und bitte sie, den Vertrag zu schicken.'”

Was MoClaw tut

1 Transkribiert die Sprachnachricht mit Whisper.
2 Sucht Sarah in Ihren Gmail-Kontakten heraus (neuester Thread).
3 Entwirft die E-Mail in Ihrem Tonfall – kurz, entschlossen, bittet um den Vertrag.
4 Fragt im Chat nach Bestätigung (da es eine echte ausgehende E-Mail ist).

Ergebnis

Die Antwort erscheint: 'Entwurf an sarah@partner.co. Betreff: Q2-Partnerschaft – Zusage von uns. Text: Sarah, wir sagen Ja zur Q2-Partnerschaft. Kannst du diese Woche den Vertrag schicken? Beste Grüße, [du]. Senden?' Sie tippen auf Senden, während Sie noch fahren.

Für diese Workflows gebaut

Workflows, die Nutzer mit Voice in MoClaw automatisieren.

Use Case

Voice integration for busy teams and founders

Teams that commonly use Voice with MoClaw workflows.

Audience

Solo Founders

SaaS, Shopify/Etsy, bootstrappers

Audience

Marketers

Content, growth, and brand teams

Passt zu

Integrationen, die häufig zusammen mit Voice verwendet werden.

FAQ

Kurze Antworten zu Preisen, Datenschutz und Limits.

Welche Sprachen unterstützt die Transkription?: Über 100 per Whisper. Pro Aufnahme automatisch erkannt. Auch das Mischen von Sprachen in derselben Aufnahme funktioniert.
Welche Stimmen kann ich wählen?: Im kostenlosen Tarif OpenAI-TTS-Stimmen (Alloy, Echo, Fable, Onyx, Nova, Shimmer). Im kostenpflichtigen der gesamte ElevenLabs-Katalog plus Stimmenklonen aus einer 30-sekündigen Probe.
Funktioniert es freihändig?: Im iOS-Telegram-Client ja – Sprache rein, Sprache raus, kein Tippen. Im Web müssen Sie jeden Zug mit der Leertaste starten (Browser-Sicherheitsbeschränkung).
Wohin geht mein Audio?: Verschlüsselt während der Übertragung, transkribiert auf einer gehosteten Whisper-Instanz, Audio innerhalb von 60 Sekunden gelöscht. Transkripte bleiben in Ihrem Chat-Verlauf (verschlüsselt, aus den Einstellungen löschbar).

MoClaw kostenlos testen.

1.000 Credits pro Monat oder eigenen Key mitbringen für unbegrenzte Nutzung.

Kostenlose Testversion

Jederzeit kündbar

Voice

So funktioniert es

Tippen Sie in jedem Chat auf das Mikrofon

MoClaw transkribiert und antwortet

Oder lassen Sie es Ihnen vorlesen

Probiere zu sagen

Schritt-für-Schritt-Demo

Für diese Workflows gebaut

AI Coffee Shop Image Generator

AI Headshot Generator

AI-Powered GIF Search and Download

GPT Image 2 Without Writing Prompts

Voice integration for busy teams and founders

Solo Founders

Marketers

Passt zu

GIF Search

Image

Video

PDF

FAQ

MoClaw kostenlos testen.