Coversong Roads

mercoledì, maggio 20, 2026

AI-Day: How to create a longer AI-Video

 


Frage:

hi Gemini, I saw on the You Tube Videos in the You Tube Channel Quantum Recao made by AI. How are these videos made?

Antwort:

The YouTube channel you are referring to is Quantum Recap (often auto-translated or slightly misheard as "Quantum Recao"). It has gained massive popularity by creating highly engaging, full-length science fiction stories, fantasy thrillers, and cinematic recaps entirely through the use of artificial intelligence.

These videos are created by combining multiple specialized AI tools into a multi-step production pipeline. Here is a breakdown of how a channel like Quantum Recap builds these videos from scratch:

1. Scriptwriting and Concept Development

Before any visuals are generated, a complete narrative or script is written.

  • The Process: The creators use advanced Large Language Models (LLMs) like GPT-4, Claude, or Gemini to brainstorm unique, high-concept sci-fi prompts (e.g., "They paid me to watch over a feline woman, but when I saw her, I knew I had to set her free").

  • The AI's Role: The AI handles building the world, pacing the plot twists, writing dialogue, and structuring the narrative into chapters so it keeps the viewer hooked for 30 to 60 minutes.

2. AI Voice Acting and Narration

The distinct, cinematic voiceovers that narrate the stories are entirely synthetic.

  • The Tools: Creators typically use high-end generative voice platforms like ElevenLabs.

  • The Technique: These platforms allow creators to select hyper-realistic, deep voice models. They adjust settings like "stability," "clarity," and "exaggeration" to make the voice sound dramatically intense, catching the tone of a Hollywood movie trailer or an immersive audiobook.

3. Visuals and Cinematic Imagery

The striking characters, otherworldly environments, and alien creatures are generated using text-to-image models.

  • The Tools: Midjourney, Stable Diffusion, or DALL-E 3 are the primary tools used here.

  • Consistency: Maintaining character consistency across dozens of scenes is one of the hardest parts. Creators do this by using specific character seeds, highly detailed descriptions, and image-to-image prompts to ensure an alien, cyborg, or protagonist looks the same in every frame.

4. Animating the Static Images (Image-to-Video)

To turn static, AI-generated artwork into moving cinematic shots, creators use advanced AI video generation platforms.

  • The Tools: Platforms like Runway (Gen-2 / Gen-3), Pika Labs, Luma Dream Machine, or Sora are used.

  • The Movement: The creator uploads the static image generated in the previous step and applies motion brushes or text commands (like "add camera pan left, subtle wind blowing hair, glowing eyes"). This transforms the flat image into a dynamic, 3-to-5-second cinematic clip.

5. Audio Design and Soundtrack

An epic sci-fi story needs an atmospheric background score and immersive sound effects (SFX).

  • The Music: Background tracks are often generated using AI music platforms like Suno or Udio, where a creator can type a prompt like "dark cinematic cyberpunk synth wave music space ambient."

  • The SFX: Ambient noises (laser blasts, robotic whirs, wind howling) are overlaid to make the digital universe feel alive.

6. Editing and Final Assembly

Once all the pieces are generated—the narration audio, the 4K AI video clips, and the music tracks—the creator brings them into a traditional video editing software (like Adobe Premiere Pro, DaVinci Resolve, or CapCut).

  • The Assembly: They align the generated video clips perfectly with the voiceover.

  • Refinements: They apply color grading to give all the different clips a unified, moody look, add transitions, and burn in stylized captions or subtitles to maximize viewer retention.

The disclaimer on the Quantum Recap channel itself summarizes this modern era of content creation: the "actors" and environments are entirely digital simulations—experimental creations made to show just how far generative AI technology has come in storytelling.

Meine Bemerkung:

I understand. It is not so, that I just get an AI a story to read and then the AI does all herself, right?

Gemini:

You are exactly right. It is not a one-click process where you just hand a story to an AI and a finished, 30-minute Hollywood-style video pops out the other side.

While there are some basic "all-in-one" AI tools (like Fliki or HeyGen) that can automatically turn text into a simple video, those are mostly designed for quick social media clips or presentation slides. They lack the cinematic depth, artistic control, and precise storytelling seen on channels like Quantum Recap.

Creating a high-quality, long-form cinematic video requires a human acting as the director, editor, and coordinator. Here is why a single AI cannot do it all by itself yet:

1. The "Hallucination" and Continuity Problem

If you give an AI a long story and say "make a movie," the AI doesn't remember what a character looked like in Scene 1 when it gets to Scene 20.

  • The Reality: The human creator has to generate the images one by one. If the story is about a specific cybernetic woman, the creator must carefully prompt the image generator over and over again to ensure her face, hair, and clothing look exactly the same throughout the entire video.

2. Lack of True Directorial Intent

An AI doesn't inherently understand dramatic pacing, comedic timing, or how to build suspense through visuals.

  • The Reality: The creator must act as the director. They choose exactly how a scene should move. For example, the human decides: "For this dramatic line of dialogue, I need a slow camera zoom on the character's eyes," and then uses an image-to-video tool (like Runway or Luma) to force that specific camera movement.

3. The Limits of Video Length

Current state-of-the-art AI video models can only generate 3 to 5 seconds of high-quality video at a time.

  • The Reality: To make a 30-minute video, a human has to generate hundreds of these tiny 4-second clips individually. Then, they must take all those pieces into traditional video editing software (like Premiere or DaVinci) and stitch them together manually, aligning them precisely with the audio track.

4. Audio Orchestration

An AI text-to-speech tool just reads the words. It doesn't know when to play a dramatic bass drop, when to fade the music out for a sad moment, or where to insert the sound of a spaceship engine roaring.

  • The Reality: The human editor mixes the audio layers—balancing the voiceover volume, timing the musical shifts, and adding background sound effects to create an immersive atmosphere.

The True Role of the Creator

Think of AI tools not as an "automated video maker," but as a massive, digital film studio. The AI provides the actors (image generation), the voice talents (voice synthesis), and the camera crew (video generation). But without the human director putting the script together, organizing the scenes, and editing the final cut, the movie would never get made.

 

martedì, maggio 19, 2026

Der Spiegel v. 24.4.26


 Überschrift „Die Luxusfalle“. Da wird an der Mehrheit der Bevölkerung vorbeigeschrieben, die sich auf härtere Zeiten einstellen muss, und für Birkin Handbags, Rolex-Uhren usw. wohl nicht so sehr viel übrig hat. Auf der anderen Seite ist es gut, wenn der Luxusappeal erklärt wird. Daß man die Objekte knapp hält, um die Spannung hochzuhalten. Nur geht das en passant an einem vorbei. Meine Uhr hat 60 Euro gekostet, die funktioniert, und das war es dann auch schon.

Dass der Kanzler Merz mit seinem Vize Klingbeil, dem Chef der anderen Koalitionspartei, der SPD ist, aneinander geraten ist, mag für wenige von Interesse sein. Aber wichtig ist, was (nach Kohl) hinten raus kommt. Und bis jetzt ist an Sozialreformen noch nichts zu sehen.

Alle rackern sich ab, geben sich Mühe, und es wird ein Ergebnis herauskommen, das sicher keinen zufriedenstellen wird. Auch weil alles so teuer ist, und Milliarden in die Verteidigung gesteckt werden, die im Grunde auch schon überholt ist, bevor sie überhaupt anfängt wirksam zu werden. Nur wird das natürlich auch zu spät gemerkt.

Da macht es doch Spass, wenn man vom ehemaligen Gesundheitsminister, dem Lauterbach hört, dass er Kniebeugen und Liegestütze macht. Und an diesem Beispiel kann man schön erklären, wieso der größte Teil der Bevölkerung zu doof ist, das nicht zu tun. (Ich schließe mich da nicht aus).

Und es wird noch schlimmer. Jetzt können Kinder in Deutschland, ein großer Teil wenigstens, noch nicht einmal richtig schreiben.

Karlsruhe kämpft gegen die Große Drüsenameise, die Fundamente, Gehwege unterhöhlt.

Es wird über Starmer, den britischen Premier, berichtet, der leicht angeschlagen ist. Von Leuten seiner eigenen Partei, von den letzten Wahlergebnissen und einigen Parteikollegen, die sich für einen Wechsel an der Spitze bereitmachen.

Der ehemalige Premier Afghanistans wird interviewt. Er muss jetzt mit dem zurechtkommen, wie es in seinem Land zur Zeit ist, in dem Mädchen ab einem bestimmten Alter nicht mehr zur Schule gehen dürfen. Das wurde von dem religiösen Chef dort untersagt, obwohl der Islam nichts dagegen hat. Ein Land, das ohne ausgebildete Frauen, keine Zukunft hat.

Und in China war die Ein-Kind-Politik ein Fehler. Von der Spitze des Landes angeordnet, und dann aufgegeben, als herauskam, dass dies eine alte Gesellschaft produzierte. Aus dieser Falle herauszukommen ist ein bisher ungelöstes Problem.

Eine Tochter der Deutschen Bahn, eine Regionalbahn, fährt in Indien und ist pünktlich. Das in Deutschland nachzumachen geht anscheinend nicht.

In einem deutschen Altersheim wird experimentiert. Es wurde mit Visoren ausgerüstet, Virtuell-Reality-Brillen, die Bewohner dort in andere Länder „transportieren“. Es wurden auch Roboter aufgestellt, die aber noch Schrott produzieren.

Wenn unter dem Beitrag „Wie viele Kassen braucht das Land“ vom Spiegel-Redakteur gesagt wird, dass ein Krankenkassenschwund nicht zu geringeren Verwaltungskosten geführt hat. Also, dann haben die dort irgendetwas falsch gemacht. Sage ich.

Es gibt einen Artikel über Mediensucht von Kindern. Andere Zeiten, andere Sitten.

lunedì, maggio 18, 2026

Newsletters


 

Aus Gizmodo:

Unter Trump verkaufen chinesische Firmen ihre Anteile an Unternehmen, die in den USA Sonnenenergie produzieren.

Im östlichen Teil der USA sind Strompreise aufgrund von Datenzentren um 76 % gestiegen.

Aus The Independence – Breaking News:

Der ehemalige Gesundheitsminister der UK, streeting fordert Starmer heraus und stellt seinen Plan vor, Großbritannien wieder in die EU zurückzuführen.

Aus Bloomberg Businessweek – Everybody´s Business:

Millionen von Hispanics, Schwarzen und jungen Amerikanern, die auf Trumps Versprechen einer wirtschaftlich besseren Zukunft vertrauten, sind enttäuscht.

Aus South China Morning Post:

Kazakhstan ist ein Land, das von China mit E-Autos und Solarpanelen geflutet wird. Das Land hat sich außerdem der Belt and Road Initiative Chinas angeschlossen.

Aus TechCrunch:

Die USA befahlen den Chinareisenden auf der Air Force One Geschenke, Nadeln and anderes von China übergebenes wegzuwerfen.

Aus The Economist:

Bereite dich auf die Job-Apokalypse vor. Sie ist noch nicht da, aber Regierungen sollten sich darauf einstellen.

Aus The Hustle:

Die NASA arbeitet an einem neuen Chip, der 500 x leistungsfähiger ist als die vorherigen. Er sollte in der Lage sein selbst Entscheidungen zu treffen, anstatt auf einen Befehl vom Boden warten zu müssen. Er soll extreme Temperaturen und Strahlungen verkraften können.

Aus 1440 Daily Digest:

Shakira, Madonna und BTS werden in der Halbzeit bei der nächsten Fussballweltmeisterschaft auftreten.

Der letzte Treibstoff ist weg in Cuba.

 


Auf dem 130. Ärztetag in Hannover wurde der Zugang der Krankenkassen zur Gesundheitsakte kritisiert.

domenica, maggio 17, 2026

Minutennovelle: Elsa Upgrade


 

Schneehausen, Restaurant, Eduard, Rich, Wochenende.

Ich könnte jetzt aufhören. Aber fangen wir erst einmal an.

Rich und Eduard lassen es sich schmecken. Eine junge Frau kommt und setzt sich an ihren Tisch.

Rich und Eduard blicken auf. Business-Anzug, Blonde Haare, grüne Augen.

Grüne Augen? Sie strahlten. Irgendwie seltsam. Eduard blickte hinein. In ihre Augen. So sahen Elsas Augen aus. „Elsa?“

„Elsa?“ Rich sah Eduard an. „Wo ist Elsa?“

„Hier am Tisch,“ erwiderte Eduard.

„Kann doch nicht wahr sein,“ meinte Rich. „Du siehst ja ganz anders aus.“

„Habe eine neue Skin bekommen,“ meinte sie nur. „Wo ist denn die Speisekarte?“

Eduard konnte nicht den Blick von ihr wenden. Elsa sah schon vorher gut aus, auch wenn sie schepperte, wenn sie irgendwo gegenstieß. Aber jetzt? Sie wirkte auf ihn wie ein Aphrodisiac.

`Bleibe ruhig, Eduard. Du bist verheiratet...´ Und dann noch. „Gefalle ich dir, Eduard?“ lächelte Elsa ihn an.

„Ja“, meinte Eduard. „Männer werden auf dich fliegen. Am besten, du wirst Nonne.“

„Haha.“ Elsa lachte. Dann wurde sie ernst. „Das kybernetische Institut, will mich nach Bisbingen senden. Ins Robotforschungsinstitut.“

Elsa bestellte. „Die dort angesiedelte Intelligenz, welche die Polizisten steuerte, macht zu viele Fehler. Da die Forscher die Quellen nicht immer ausfindig machen können, soll ich ihnen helfen.

Roboter werden als Polizisten erst dann wieder eingesetzt, wenn wenn sie keinen Unsinn mehr machen. - Wir wollen sie auf dem Gelände behalten und dort testen.“

„Na dann viel Spass dabei,“ meinte Rich, und dachte an die AI in seiner Firma. Das Unternehmen, in dem er arbeitete stellte Geschirr her wie Teller, Tassen, Eierbecher. Doch die AI lieferte nur Rechenergebnisse. Er fühlte sich nutzlos. Vor einem Jahr, als sie ihn zum Promptingeneur befördert hatten, waren sie Feuer und Flamme. Sie dachten, Arbeiten würden langsam aber sicher alle von der AI gemacht werden.

„In unserem Unternehmen arbeiten wir uns noch an den Agenten ab. Das ist nichts halbes und nichts ganzes. Die AI kann zwar Rechnungen drucken. Aber das konnten wir vorher auch. Es fehlt an übergreifender Digitalisierung.“

„Obwohl ihr Fortschritte macht, wird es länger dauern als angenommen.“

„Und darauf wollen wir einen trinken. Für uns gibt es nach wie vor Arbeit,“ meinte Eduard und erhob das Glas.




sabato, maggio 16, 2026

Newsletters

Aus The Daily Upside:

Ford gründete eine Tochtergesellschaft, die Batterien für Datencenter herstellt.

Peking will 200 Boeing Flugzeuge bestellen, die USA gaben den Verkauf von Nvidias H200 Chips an China frei und Peking versprach bei der Freigabe der Straße von Hormuz behilflich zu sein.

Seit 70 Jahren hatte Honda zum ersten Mal einen Verlust zu verzeichnen. Es zog sich vom E-Fahrzeugmarkt zurück, der keinen Gewinn brachte.

The Deep View:

Ein Codex Agent kann von ChatGPT über ein Smartphone gesteuert werden. Mit der App kann man alle Programme sehen, die dein Agent laufen lässt. Alle Outputs ansehen, Befehle genehmigen, Modelle wechseln, sich Screenshots ansehen, eine neue Aufgabe durchführen.

(also, ich weiß nicht, wozu das alles gut ist. Das kann ich doch auch.)

Aus Bloomberg – Evening Briefing:

Der deutsche Bundeskanzler März meinte: „ich bin ein Bewunderer von Amerika, aber zur Zeit steigt sie nicht an. Ich würde nicht empfehlen, meine Kinder wegen der sozialen Umstände dort leben zu lassen.“

Aus TechCrunch:

Was passiert, wenn eine AI sich selbst baut? Es wird schon versucht, das anzuleiern. Richard Socher gründete eine neue App „Recursive.SI (Recursive Superintelligence)“, die eigene Schwächen findet, Verbesserungen entwirft, und diese ohne menschliche Hilfe implementiert. Socher hat dafür 650 Millionen $ eingesammelt.

Aus Bloomberg – Green Daily:

Kanada erweitert sein E-Netz. Es soll bis 2050 verdoppelt werden, wird über alles 729 Milliarden $ kosten.

Saubere Energie scheint von der Hormuz-Krise unberührt zu sein.

Aus Bloomberg – Fünf Themen des Tages:

Der amerikanische Präsident Trump nutzt die Gelegenheit und dealt fleißig mit Aktien. Im 1. Quartal butterte er pro Nvidia, Oracle, Microsoft, Costco und Boeing jeweils 5 Millionen $ hinein. So kommt es natürlich gut zu pass, dass er China 200 Boeings aufdrücken konnte.

In Europa gibt es eine Menge Solarzellen. Nur ist das E-Netz nicht dafür vorbereitet. So werden Terrawattstunden ungenutzt hergestellt, was für den Verbraucher negativ ist.

venerdì, maggio 15, 2026

Newsletters

 


Aus Bloomberg – Balance of Power:

In der Hormuz-Straße wurde ein Schiff von nicht authorisiertem Personal beschlagnahmt. Ein japanischer Supertanker schaffte es hindurch und zwei auf Indien zufahrende Schiffe, die Kochöl geladen hatten ebenfalls, unbehelligt durch die Straße zu kommen.

Das Treffen des französichen Präsidenten Macron in Nairobi brachte Milliarden Euros als Investment für Afrika auf. Aber es machte auch sichtbar, das Afrika auch von China, der Sowjetunion, Indien und der Türkei vereinnahmt wurde.

US-Raffinerien senden mehr als je zuvor Treibstoff für Flugzeuge ins Ausland.

Aus The Hustle:

62 % US-amerikanischer Mädchen im Alter von 5-13 Jahren sehen AI-Assistenten als Freunde, gemäß einer Untersuchung von Girl Scouts of America. Freunde, die witziger, cooler und schlauer als ihre Eltern sind. Sie fanden auch heraus, dass 50 % der Mädchen Ais besser als ihre Eltern fanden, wenn es darum ging, ihnen bei Hausaufgaben, Pop Kultur behilflich zu sein und sie zum lachen zu bringen.

Aus Morning Brew:

Trump traf mit einer amerikanischen Wirtschaftsdelegation und ein paar Ministern in China ein.

Kevin Warsh ist neuer Fed Boss.

Anthropic hat jetzt mehr Geschäftskunden als OpenAI.

Aus 1440 Daily Digest:

Die erste Zahnwurzelbehandlung wurde vor 59.000 Jahren durch einen Neanderthaler ausgeführt, so berichteten Archäologen.

Aus Bloomberg – Evening Briefing:

Cisco Aktienkurse stiegen um17%, nachdem die Gesellschaft ein über die Voraussage ragendes Einkommen ankündigte und sagte, dass es um 4000 Mitarbeiter entlassen würde, um Kosten zu senken. - Das gleiche gilt für Linkedln.

Aus Superintelligence:

Isomorphic bringt 2.1 Milliarden $ auf, um das AI-Medikamentendesign voranzutreiben.

Japan testet ein menschenfreies Roboterlabor. Das Institute of Science Tokyos Robotics Innovation Center läßt 10 Roboter in einem Labor allein vor sich hin walten und schalten. Bis 2040 sollen es 2000 Roboter werden.

AI-Datencenter in ihrer lokalen Aera drängt die ansässige Bevölkerung in die Opposition. Nuklear-anlagen riefen weniger Widerstand hervor.

giovedì, maggio 14, 2026

Der Spiegel v. 24.4.2026

 


Eine Sonderausgabe. Sieht so aus, als ob der Spiegel glaubt, sie sei nötig. Überschrift „Die Lage der Nation“. Vorbei sind die Zeiten, in der es unter der Kanzlerin Merkel in Deutschland ruhig war: Wenigstens, solange Immigranten das Land nicht überschwemmten. Es war Wohlstand da, und der Eindruck war vorhanden, es ginge immer weiter aufwärts. Obwohl gerade in der Merkel-Ära die Grundsteine für einen rasanten Abstieg der deutschen Wirtschaft gelegt wurden.

Das bricht jetzt aus, und daher diese Spiegel-Ausgabe. Nur ist die Demokratie, wie sie heute in Deutschland existiert, nicht das geeignete Mittel, ein Land voranzubringen. Entscheidungsabläufe sind zu langsam. Das kann sich Deutschland nicht leisten.

Und damit ist im Grunde alles gesagt. Und ich lege diese Ausgabe mal auf den Entsorgungshaufen.