Har du lyst å koma i gang med KI men ikkje veit kor du skal begynna? Start med generativ KI og leik med animasjon – sjå kor nyttig det er å kombinera ulike verktøy!
Oppskrift: Kom i gang med generativ KI
Denne vesle animasjonsøvinga tek deg gjennom ei rekkje mogelegheiter innan generativ KI på ein gong. Kjapt og kjekt! Slik lagar du din første KI-genererte animasjonsvideo:
- Bruk ChatGPT til å laga ein prompt (instruks) til eit bildeverktøy som lagar eit bilde som kan animerast
- Bruk eit bildeverktøy som Dall-e eller Midjourney til å laga bildet med instruksen frå ChatGPT
- Bruk ChatGPT til å skriva ein tekst som skal
- Bruk Elevenlabs til å konvertera teksten til ei stemme
- Bruk D-ID eller HeyGen til å animera videoen.
Sjå gjerne VisitVoss si kulturløype der dei har animert bilde av statuane på Voss. Dei har brukt HeyGen til dette prosjektet.
Her er ein video eg har laga med ChatGPT, Elevenlabs, Midjourney og D-ID:
Her er ei gammal koltegning av Marcus Gerhard Hoff Rosenkrone teikna av Lars Osa kjørt gjennom Midjourney for å få ei yngre og meir fotografi-liknande utgåve og deretter animert med dansk mannsstemme der han les eit dikt av Jørgen Moe om det store maleriet i Den Røde Sal på Baroniet Rosendal av Hans Gude:
Her er steg for steg tips til korleis du får det til:
Generera tekst med ChatGPT
Til å skriva tekst er sjølvsagt ChatGPT der du startar. Tenk at Google var ein bibliotekar som du kunne be om å henta ferdige dokument til deg. ChatGPT er ein litt dum sekretær som kan skriva ganske gode tekstar for deg, men den treng veldig klare instruksjonar for å gjera jobben slik du vil. Dette kallast instruksdesign eller prompt engineering.
Gratis kurs på Digital Norway
Sjå gratis introduksjonskurs på Digital Norway om ChatGPT og kurs i prompt engineering (instruksdesign).
Øv deg på instruksdesign
I ChatGPT er at det er smart å gje den ei rolle «du er ekspert i kunstig intelligens» eit oppdrag «du skal no skriva ein prompt til Midjourney» og eit ønska resultat f.eks. «som resulterer i eit foto-realistisk bilde av ei prinsesse som ser ut av eit vindu i tårnet. Ho ser utover ein skog der ein ridder kjem i retning tårnet på ein kvit hest». Husk også kor lang teksten skal vera, f.eks 100 ord, stil og tone, (formell eller dagligtale? Sjørøver eller direktør?). Det er også smart å gje den instruks på engelsk og heller bruka ChatGPT til å oversetja til Norsk etterpå sidan det aller meste av læringsdatamaterialet er på engelsk. Dette er også eit godt tips: Bruk heller ChatGPT til å oversetja tekstar enn Google Translate! Då får du betre resultat og du kan instruera den til kva stil (formelt, daglegtale, drøymande, humoristisk, sjørøvarspråk…).
Hopp i det og prøv!
Det viktigaste her er å huska å ikkje mata inn personopplysningar, ellers er det største problemet fantasien sine grenser. Les alle ChatGPT cheat sheets du kjem over i sosiale medier og få stadig nye idéar til kva dette fantastiske verktøyet kan brukast til. Om du betalar 200 kroner i månaden får du eit endå kraftigare verktøy med plug-ins som gjer at du kan oppsummera nettsider, planlegga reiser med f.eks. Skyscanner, få oversikt over fagområde, få tips til korleis setja opp eit dokument etc. etc.
Bildegenerering
Bildegenerering er lett å få til i Midjourney eller Dall-e, enten med utgangspunkt i eit bilde som du kan lasta opp, eller basert kun på tekstinstruksar inn til programmet.
Ikkje gje deg etter første forsøk, du kan generera bilde på nytt om du ikkje er fornøyd, eller ta det alternativet du er mest fornøyd med og laga nye variantar av dette. Ta gjerne fleire rundar heilt til du bli fornøyd. Tips: gå tilbake til ChatGPT for å be den fiksa på instruksen slik at du får med det du ser manglar eller det du vil forbedra. Når du er fornøyd kan du kopiera bildet, f.eks. ta ein skjermdump.
Dall-e
Utvikla av OpenAI og er kjent for å vera bra til å generera svært kreative og gjerne fantasifulle bilde basert på tekstskildring. Veldig bra til
- Kreativ konseptutvikling: bra til å omforma abstrakte konsept og tankar til visuelle representasjonar, perfekt til idémyldring og konseptuell kunst.
- Illustrasjonar, kunstverk eller grafisk design basert på spesifikke instruksar. Her kan du få unike og varierte stilar.
- Bra til å generera nøyaktige og detaljrike bilde av objekt eller scenar ut i frå ein tekst.
Midjourney
Utvikla av eit uavhengig forskingslaboratorium, og må koblast til ein Disccord-konto sjå her korleis du kjem i gang med Midjourney. Når du har Discord på maskina di er det veldig kjapt å gå inn og laga bilde! Har fort blitt mitt favorittverktøy.
- Kunstnerisk utforskning: kjempebra til å skapa kunstverk, spesielt dei som har litt abstrakte, surrealistiske eller sterkt stiliserte visuelle uttrykk.
- Stemning og atmosfære: bra dersom du treng ei viss stemning, atmosfære eller spesielt estetiske bilde.
- Inspirasjon og konseptkunst: også bra til å generera veldig kreative bilde eller konseptkunst.
Her er tips til Midjourney prompts
Vil du laga eit foto om til eit maleri? Då kan du prøva Deep Art.
Tekst til tale med Elevenlabs
Elevenlabs er genialt frå tekst til tale. Tips: be ChatGPT skriva ein tekst f.eks. på 100 ord om prinsessa i tårnet som fortel om livet sitt der oppe i tårnet og korleis ho lengtar etter riddaren sin. Kopier teksten inn i Elevenlabs og velg ei kvinnestemme du syns passar. Når du klikkar på Generate vil den laga ei nedlastbar lydfil til deg.
Videoanimasjon med D-ID eller HeyGen
Ta bildet du har laga f.eks. i Midjourney og lydfila frå elevenlabs og last det opp i eit videoprogram som f.eks. D-ID (billig og bra, gratis prøveversjon) eller HeyGen (litt dyrare men meir avansert/fleire ting du kan gjera, som å oversetta video til mange språk).
Her kan du lasta opp bildet og lydfila og få ferdig animert video!
Har du eit spennande KI-prosjekt på gang? Send meg gjerne ein e-post om det!