Oslo, Norway
59° / 60° N
Follow us

Hva er prompt engineering?

Prompt engineering er en måte å lage en samtale mellom deg og den AI-motoren du bruker, gjennom å mate inn oppgavespesifikke ledetekster. Den informasjonen du gir AI-motoren, er utgangspunktet for hva som vil genereres, og er av avgjørende betydning for resultatet.

Tips til prompt engineering:

  • Hold den kort og spesifikk
  • Bruk relevant kontekst i samtale
  • Vær tydelig på ønsket utgang, hvis du har en bestemt type utgang i tankene
  • Unngå å gi for mye spesifikk informasjon
  • Prøv med forskjellige forespørsler for å se hva som fungerer best

Dette trenger du for å skape en snakkende 3D-karakter

Til min snakkende 3D-karakter brukte jeg AI-tjenestene:

ChatGPT er gratis å bruke, men Midjourney og D-ID har en grense på hvor mye du kan bruke tjenestene før du må betale.

Før du starter er det, som alltid, smart å ha en grov idé om hva du ønsker å lage. Noen spørsmål du kan stille deg selv er: Hva slags historie jeg vil lage? Ønsker jeg noen spesifikke hendelser? Hvordan ser jeg for meg karakteren? Å ha dette noenlunde klart for seg, er til hjelp når du instruerer AI-tjenestene.

I dette tilfellet ønsket jeg å lage en karakter inspirert av min kollega Eldar, og å gjøre ham til en robot med kunstig intelligens, som får jobb i et reklamebyrå!

Og det fikk jeg til! Slik gjør du også det, trinn for trinn:

Trinn 1: ChatGPT

Lag en historie med ChatGPT:

  1. Oppgi en detaljert "prompt"
  2. Bruk den genererte historien som utgangspunkt, hvis du ikke er fornøyd kan du be ChatGPT om å redigere den
  3. Juster historien manuelt om ønskelig


Chat GPT prompt og tekst resultat

Trinn 2: Midjourney

Lag karakter med Midjourney:

Jeg benyttet en prompt som heter "IMG + Text". Det betyr at jeg brukte nettadressen til et bilde pluss en tekstbeskrivelse.

  1. Finn et referansebilde
  2. Lim inn URL til referansebildet samt en tekstbeskrivelse for å generere en karakter
  3. Velg det beste resultatet ved å klikke på U1, U2, U3, U4 (U = Upscale"), eller generer flere bilder til du er fornøyd
Dette er resultatet jeg fikk av Midjourney. Her har jag klikket på “U3 & U4”, dette sier til Midjourney at jeg ønsker å generere disse bildene til en høyre kvalitet og jag kan deretter lagre dem. Hvis jeg hadde ønsket flere varianter av bildene kan jeg velge å klikke på “V3 eller V4”. Da vil jeg få fire nye bilder av hvert bilde.
Bilde generert i Midjourney

Trinn 3: D-ID

Lag animasjon og voice med D-ID:

  1. Last opp bildet generert i trinn 2 til D-ID
  2. Lim inn historien som ble generert i trinn 1
  3. Velg en foretrukket stemme for animasjonen
  4. Trykk på "Spill av lyd" og lytt til historien. Juster ord om nødvendig for å få en jevn flyt
  5. Klikk "Generer video" og vent på resultatet


Video thumbnail

Resultatet er imponerende, men ikke perfekt

Den siste måneden har jeg brukt utallige timer på å prøve forskjellige AI-tjenester og eksperimentert for å se hva som er mulig og ikke. Jeg har generert kode, alle slags datatabeller, ideer til innlegg på sosiale medier, rammer for tekstforfatting, historier, e-bøker, bilder, god natt-eventyr, videoer, måltidsplaner som inkluderer handlelister og oppskrifter, og så videre.

Men for noen dager siden, da jeg for første gang prøvde å bruke denne kombinasjonen av AI-tjenester, ble jeg skikkelig imponert over resultatet. Selv om animasjonen ikke er perfekt, eller ikke kan tilpasses, og voice-overen er den samme gamle roboten, er det imponerende hva som kan oppnås i løpet av ikke mer enn 30 minutter.

Hvis vi kan lage dette nå, prøv å forestill deg hva vi kan lage ved å bruke AI som verktøy i tiden som kommer. Best å holde seg oppdatert!

Nyheter/Artikler