Antragsprozess
Um die API zu nutzen, müssen Sie zunächst auf die entsprechende Seite der Veo Videos Generation API gehen und den entsprechenden Dienst beantragen. Nach dem Betreten der Seite klicken Sie auf die Schaltfläche „Acquire“, wie im Bild gezeigt:
Wenn Sie noch nicht angemeldet oder registriert sind, werden Sie automatisch zur Anmeldeseite weitergeleitet, um sich zu registrieren und anzumelden. Nach der Anmeldung werden Sie automatisch zur aktuellen Seite zurückgeleitet.
Bei der ersten Beantragung gibt es ein kostenloses Kontingent, mit dem Sie die API kostenlos nutzen können.
Grundlegende Nutzung
Zunächst sollten Sie die grundlegende Nutzung verstehen, indem Sie die Eingabeaufforderungprompt, die Generierungsaktion action, das Array der Referenzbilder für den ersten und letzten Frame image_urls sowie das Modell model eingeben, um das verarbeitete Ergebnis zu erhalten. Zunächst müssen Sie ein einfaches action-Feld übergeben, dessen Wert text2video ist. Es gibt hauptsächlich drei Aktionen: Text zu Video (text2video), Bild zu Video (image2video), 1080p-Video abrufen (get1080p). Dann müssen wir auch das Modell model eingeben, das derzeit hauptsächlich die Modelle veo2, veo2-fast, veo3, veo31, veo31-fast, veo31-fast-ingredients und veo3-fast umfasst. Die genauen Inhalte sind wie folgt:

accept: In welchem Format Sie die Antwort erhalten möchten, hier eingetragen alsapplication/json, also im JSON-Format.authorization: Der Schlüssel zur API-Nutzung, den Sie nach der Beantragung direkt auswählen können.
model: Das Modell zur Videoerzeugung, hauptsächlichveo2,veo2-fast,veo3,veo31,veo31-fast,veo31-fast-ingredientsundveo3-fast.action: Die Aktion dieser Videoerzeugungsaufgabe, die hauptsächlich drei Aktionen umfasst: Text zu Video (text2video), Bild zu Video (image2video), 1080p-Video abrufen (get1080p).image_urls: Wenn die Aktion Bild zu Video (image2video) gewählt wird, müssen die Links zu den Referenzbildern für den ersten und letzten Frame hochgeladen werden, maximal drei Referenzbilder.resolution: Wählen Sie die Auflösung des zu generierenden Videos, wobei das veo31-Modell 4k-Auflösung unterstützt, andere Modelle nicht. Alle Modelle unterstützen 1080p und gif-Auflösung. Wenn dieser Wert nicht übergeben wird, wird standardmäßig 720p verwendet, hauptsächlich unterteilt in:1080p,gif,4k.prompt: Eingabeaufforderung.callback_url: Die URL, an die das Ergebnis zurückgerufen werden soll.
📌 Zusammenfassung der Modellbeschreibung
| Modellname | Unterstützte Modi | Bild-Eingaberegeln |
|---|---|---|
| veo2-fast | Text zu Video (ohne Bild) Bild zu Video-Modus (mit Bild) | Unterstützt nur 1 Bild → Erstes Frame-Modus |
| veo3-fast | Text zu Video (ohne Bild) Bild zu Video-Modus (mit Bild) | 1 Bild → Erstes Frame-Modus 3 Bilder → Erstes und letztes Frame-Modus |
| veo31-fast | Text zu Video (ohne Bild) Bild zu Video-Modus (mit Bild) | 1 Bild → Erstes Frame-Modus 3 Bilder → Erstes und letztes Frame-Modus |
| veo31-fast-ingredients | ❌ Text zu Video (nicht unterstützt) ✅ Zwang zur Mehrbildfusion (Bilder müssen übergeben werden) | 1-3 Bilder → Mehrbildfusionsmodus (maximal 3 Bilder) |
| veo2 | Text zu Video (ohne Bild) Bild zu Video-Modus (mit Bild) | 1 Bild → Erstes Frame-Modus 3 Bilder → Erstes und letztes Frame-Modus |
| veo3 | Text zu Video (ohne Bild) Bild zu Video-Modus (mit Bild) | 1 Bild → Erstes Frame-Modus 3 Bilder → Erstes und letztes Frame-Modus |
| veo31 | Text zu Video (ohne Bild) Bild zu Video-Modus (mit Bild) | 1 Bild → Erstes Frame-Modus 3 Bilder → Erstes und letztes Frame-Modus |
🔑 Erklärung der Schlüsselregeln
- Allgemeine Logik:
- Keine Bild-Eingabe → Automatischer Trigger für den Text zu Video-Modus.
- Bild-Eingabe vorhanden → Trigger für den Bild zu Video-Modus (konkretes Verhalten hängt von der Anzahl der Bilder ab).
- Typen des Bild zu Video-Modus:
- Erstes Frame-Modus (1 Bild): Erstes Frame ist das eingegebene Bild.
- Erstes und letztes Frame-Modus (2 Bilder): Erstes und letztes Frame sind die eingegebenen Bilder.
- Mehrbildfusionsmodus (1-3 Bilder): Nur
veo31-fast-ingredientsunterstützt dies, um Inhalte mehrerer Bilder zu fusionieren und ein Video zu generieren.
- Modus-Kategorisierung:
- Schnell-Modus:
veo2-fast,veo3-fast,veo31-fast,veo31-fast-ingredients. - Qualitäts-Modus:
veo2,veo3,veo31(höhere Generierungsqualität).
- Schnell-Modus:
⚠️ Hinweise
- Einziges Modell mit zwingender Bildübertragung:
veo31-fast-ingredientsmuss Bilder übergeben (1-3 Bilder), sonst kann es nicht ausgeführt werden. - Bildanzahl-Beschränkung:
- Abgesehen von
veo31-fast-ingredientsunterstützen andere Modelle maximal 3 Bilder als Eingabe.
- Abgesehen von

success,der Status des Videoerstellungsauftrags zu diesem Zeitpunkt.task_id,die ID des Videoerstellungsauftrags zu diesem Zeitpunkt.data,das Ergebnis des Videoerstellungsauftrags zu diesem Zeitpunkt.id,die Video-ID des Videoerstellungsauftrags zu diesem Zeitpunkt.video_url,der Video-Link des Videoerstellungsauftrags zu diesem Zeitpunkt.created_at,die Erstellungszeit des Videoerstellungsauftrags zu diesem Zeitpunkt.complete_at,die Abschlusszeit des Videoerstellungsauftrags zu diesem Zeitpunkt.state,der Status des Videoerstellungsauftrags zu diesem Zeitpunkt.
data abrufen, um das generierte Veo-Video zu erhalten.
Wenn Sie den entsprechenden Integrationscode generieren möchten, können Sie ihn direkt kopieren, zum Beispiel ist der CURL-Code wie folgt:
Bild-zu-Video-Funktion
Wenn Sie ein Video basierend auf den ersten und letzten Bildrahmen erstellen möchten, können Sie den Parameteraction auf image2video setzen und ein Array von Bild-URLs für die ersten und letzten Bildrahmen eingeben.
Als nächstes müssen wir die nächsten Schritte ausfüllen, um die Eingabeaufforderung anzupassen, um das Video zu generieren, und können die folgenden Inhalte angeben:
model:das Modell zur Videoerstellung, hauptsächlichveo2、veo2-fast、veo3undveo3-fast.image_urls:Wenn Sie die Bild-zu-Video-Aktionimage2videoauswählen, müssen Sie die Referenzbilder für die ersten und letzten Bildrahmen hochladen.prompt:Eingabeaufforderung.


1080p-Video-Funktion abrufen
Wenn Sie ein bereits generiertes Veo-Video in 1080p abrufen möchten, können Sie den Parameteraction auf get1080p setzen und die ID des Videos eingeben, das Sie in 1080p abrufen möchten. Die Video-ID wird basierend auf der grundlegenden Verwendung abgerufen, wie im folgenden Bild gezeigt:

Hinweis: Hier ist die video_id im Video die ID des nach der Erstellung generierten Videos. Wenn Sie nicht wissen, wie Sie ein Video erstellen, können Sie sich auf die grundlegende Verwendung im obigen Text beziehen, um ein Video zu erstellen.
Als nächstes müssen wir die nächsten Schritte ausfüllen, um die Eingabeaufforderung anzupassen, um das Video zu generieren, und können die folgenden Inhalte angeben:
model:das Modell zur Videoerstellung, hauptsächlichveo2、veo2-fast、veo3undveo3-fast.video_id:die Referenz-Video-ID, um das 1080p-Video abzurufen.


Generierung eines Videos mit festgelegten Abmessungen
Wenn Sie ein Veo-Video mit benutzerdefinierten Abmessungen erstellen möchten, können Sie den Parameteraspect_ratio auf die gewünschte Größe setzen. Als nächstes müssen wir die nächsten Schritte ausfüllen, um die Eingabeaufforderung anzupassen, um das Video zu generieren, und können die folgenden Inhalte angeben:
model:das Modell zur Videoerstellung, hauptsächlichveo2、veo2-fast、veo3undveo3-fast.aspect_ratio:die Größe des Videos, derzeit unterstützt:16:9、16:9、3:4、4:3、1:1,standardmäßig ist16:9.translation:ob die automatische Übersetzung der Eingabeaufforderung aktiviert werden soll, standardmäßig istfalse. Ein Beispiel für die Eingabe sieht wie folgt aus:


Asynchrone Rückrufe
Da die von der Veo Videos Generation API benötigte Zeit relativ lang ist, etwa 1-2 Minuten, bleibt die HTTP-Anfrage bei längerer Nichtreaktion der API verbunden, was zu einem zusätzlichen Verbrauch von Systemressourcen führt. Daher bietet diese API auch Unterstützung für asynchrone Rückrufe. Der gesamte Ablauf ist: Wenn der Client die Anfrage stellt, gibt er zusätzlich ein Feldcallback_url an. Nachdem der Client die API-Anfrage gestellt hat, gibt die API sofort ein Ergebnis zurück, das Informationen über ein task_id-Feld enthält, das die aktuelle Aufgaben-ID darstellt. Wenn die Aufgabe abgeschlossen ist, wird das Ergebnis der Videoerstellung in Form von POST JSON an die vom Client angegebene callback_url gesendet, wobei auch das task_id-Feld enthalten ist, sodass die Aufgabenergebnisse über die ID miteinander verknüpft werden können.
Lassen Sie uns anhand eines Beispiels verstehen, wie dies konkret funktioniert.
Zunächst ist der Webhook-Rückruf ein Dienst, der HTTP-Anfragen empfangen kann. Entwickler sollten die URL ihres eigenen HTTP-Servers angeben. Hier verwenden wir zur Veranschaulichung eine öffentliche Webhook-Beispielwebsite https://webhook.site/, auf der Sie eine Webhook-URL erhalten können, wie im Bild gezeigt:
Kopieren Sie diese URL, um sie als Webhook zu verwenden. Das Beispiel hier lautet https://webhook.site/aed5cd28-f8aa-4dca-9480-8ec9b42137dc.
Als Nächstes können wir das Feld callback_url auf die oben genannte Webhook-URL setzen und die entsprechenden Parameter ausfüllen, wie im Bild gezeigt:

https://webhook.site/aed5cd28-f8aa-4dca-9480-8ec9b42137dc beobachten, wie im Bild gezeigt:
Der Inhalt lautet:
task_id-Feld vorhanden ist, und die anderen Felder sind ähnlich wie oben, sodass die Aufgabenverknüpfung über dieses Feld realisiert werden kann.
Fehlerbehandlung
Wenn beim Aufruf der API ein Fehler auftritt, gibt die API den entsprechenden Fehlercode und die Informationen zurück. Zum Beispiel:400 token_mismatched: Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.400 api_not_implemented: Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.401 invalid_token: Unbefugt, ungültiger oder fehlender Autorisierungstoken.429 too_many_requests: Zu viele Anfragen, Sie haben das Kontingent überschritten.500 api_error: Interner Serverfehler, etwas ist auf dem Server schiefgelaufen.

