Jag har tidigare skrivit om AI och hur du kan skapa dina egna AI bilder genom att installera Stable Diffusion på din dator. När du installerar AI för att skapa dina egna bilder, så slipper du även den censurering som de flesta sidor och appar implementerar. Många kanske tror att det bara finns en anledning till varför man inte vill använda en censurerad verion av AI för att generera bilder. Men det är långt ifrån bara snuskgubbar som skapar NSFW bilder som vill slippa censuren.
Är censurerade AI bilder bra eller dåligt?
Censurerade AI kan inte sägas vara varken bra eller dåligt, utan det beror helt på sammanhanget. Eftersom AI som genererar bilder finns tillgängligt överallt på internet och som appar i våra telefoner, så tycker jag att censuren ändå har ett syfte. Ingen normal människa vill att deras barn ska sitta och skapa bilder av grov pornografisk karaktär, oavsett om det sker av misstag eller medvetet.
Censur filter fungerar inte alltid som de var tänkta dock, och använder man ett annat språk än engelska kan det ibland tolkas som att man medvetet försöker kringgå filtret. Detta kan leda till att man bli blockad från AI sidan eller appen, i vissa fall permanent. Censuren fångar dessutom ofta upp även lättklädda bilder, eller bilder som kan tolkas som våldsamma. Om man dessutom är en seriös användare och kreativ konstnär, så vill man absolut inte behöva tänka sig för hur man formulerar en promt.
Är bildskapande AI användarvänlig?
Även detta är en fråga som inte har något rakt och direkt svar. Om du googlar “Skapa AI bilder” så upptäcker du snart att det finns oändliga mängder webbsidor och appar som erbjuder sina tjänster. Vissa helt gratis, några som är gratis med en valfri betaltjänst och många som drivs med reklamintäkter. Att hitta rätt är med andra ord inte helt enkelt.
Generellt kan man säga att de flesta webbsidor och appar som erbjuder tjänsten är relativt enkla att använda. Men om du inte använder deras betaltjänst så tvingas du genomlida en hel del reklam, långa köer och även censuren. Det som egentligen är av intresse är ifall AI som du kör från din egen dator är användarvänlig eller inte.
I mitt inlägg där jag beskrev hur du kan installera Stable Diffusion på din dator kan man se att just den versionen körs helt och hållet med textkommando. För den som är ovan är detta inte särskilt användarvänligt, och dessutom tog den versionen stora resurser i anspråk och tog lång tid att generera bilder.
AI utvecklas nu i en rasande fart, och det är enormt många människor som frivilligt hjälper till med utvecklingen och delar med sig av sina projekt. Det innebär att inlägget jag skrev för 5 månader sedan mer eller mindre är helt och hållet utdaterat. Det finns AI som är snabbare, bättre och enklare att använda nu. När jag skriver “AI” här, så blir det lite missvisande eftersom det vi kallar AI i stort sett är en modell som har tränats till att göra vissa saker. Som att skapa bilder av text.
Använda UI för att skapa AI bilder
Vad är UI för något kanske någon undrar, och nedan är en enkel förklaring.
Enkelt kan man förklara UI som en serie av visuella element som gör det möjligt för användaren att interagera med en produkt eller system. Ett UI element kan vara en knapp, en skärm, ett ljud eller en sida. Något användaren kan trycka på, se, höra eller interagera med för att kunna göra ett informationsutbyte. UI-design fokuserar på produkter och systems utseende och känsla, hur yta ser ut och fungerar. UI syftar på att enbart visuellt vägleda användaren genom en produkt eller systems användargränssnitt.
Xlent
Det finns numera en rad olika alternativ för att använda UI för att arbeta med AI som du installerat lokalt på din dator. Jag ska gå igenom en av dem, och den heter ComfyUI. Den går att installera och använda på både Windows och Mac datorer, men eftersom jag använder Windows så är det den jag kommer gå igenom.
Installera ComfyUI
Först och främst behöver du någon form av komprimeringsprogram. Säkerligen har du Winrar eller Winzip på din dator sedan tidigare, men jag rekommenderar att installera 7-Zip.
Du kan ladda ner programmet här –> Ladda ner 7-Zip
När du har laddat ner och installerat 7-Zip behöver du ladda ner själva ComfyUI.
Du hämtar ComfyUI här –> Ladda ner ComfyUI
Filen är ungefär 1,5 GB stor och kan ta en stund att ladda ner beroende på din internetuppkoppling.
Den nedladdade filen heter ComfyUI_windows_portable_nvidia_cu118_or_cpu.7z. När du högerklickar på filen ska du välja 7-Zip –> packa upp här, vilket kommer att skapa en mapp som heter ComfyUI_windows_portable. Processen kan ta en stund och det är viktigt att du inte avbryter den.
När 7-Zip är klar så har du en mängd filer och mappar i den mappen som heter ComfyUI_windows_portable, och du kan nu flytta hela foldern till någon annanstans på din dator.
Nästa steg är att ladda ner en eller flera modeller (det som vi ibland lite slarvigt refererar till som AI). Det går utmärkt att kopiera modellen från Stable Diffusion om du tidigare installerat den versionen jag skrivit om här.
Du kan även ladda ner modellen här –> Ladda ner Stable Diffusion v. 1.4
Efter du har laddat ner modellen så hittar du filen med namnet sd-v1-4.ckpt. Du ska nu flytta eller kopiera den filen till checkpoints som du hittar i din ComfyUI folder. Det är även i den foldern du sparar andra modeller som du kan ladda ner vid ett senare tillfälle.
Nu har du alla grundläggande filer som du behöver för att köra Stable Diffusion med hjälp av ComfyUI.
För att starta går du till din ComfyUI_windows_portable mapp och där finns 2 olika .bat filer. Om du har ett Nvidia grafikkort så startar du genom att dubbelklicka på file som heter run_nvidia_gpu, och har du något annat grafikkort dubbelklickar du på run_cpu. Att köra AI genom processorn (run_cpu) är mycket långsammare än att göra den genom grafikkortet.
Hur använder man ComfyUI?
När du startar ComfyUI för första gången, så kommer programmet att öppnas i din webbläsare och se ut ungefär så här.
ComfyUI är från början förinställd på att skapa en test bild, så om du inte ändrar några inställningar utan trycker på Queue Promt så kommer det generera en bild som liknar denna.
Alla bilder som du skapar kommer att sparas i mappen Output som du hittar i ComfyUI_windows_portable –> ComfyUI –> output
De olika delarna i ComfyUI
Jag ska gå igenom de mest grundläggande delarna på själva arbetsytan i ComfyUI, en mer djupdykning får ske i ett separat inlägg.
Load Checkpoint
Här laddar du själva AI modellen (sd-v1-4.ckpt som du laddade ner tidigare). Den modellen jag har just här är Stable Diffusion verion 3 (sd_v3). Olika modeller har tränats för olika saker. Det finns till exempel en modell som heter Anything v3 som är särskilt tränad i att skapa anime bilder, eller Realistic Vision V2 som är speciellt tränad i att skapa realistiska bilder.
Text Encode (Prompt)
I den översta textrutan skriver du in nyckelord som beskriver vad du vill att din bild ska innehålla. Den nedersta textrutan är en så kallad negative prompt, vilket innebär att du här skriver in sådant som du inte vill ska finnas med i din bild. Text är en bra sak att ha här, eftersom AI i många fall inte fattar vad text och språk är utan istället generear textliknande mönster.
Empty Latent Image
Här anger du storleken på bilden du vill skapa i width och height samt hur många bilder som skapas åt gången i batch_size. Jag rekommenderar att inte ändra själva storleken, utan att istället skala upp bilden vid ett senare tillfälle. Större bild tar fler resurser i anspråk och tar längre tid att skapa. Du kommer att märka att du snabbt har skapat ett par hundra bilder som ser nästan likadana ut under tiden du försöker hitta rätt inställningar.
KSampler
Man skulle kunna säga att det är här som du finjusterar inställnigen för dina bilder.
Seed är ett slumpmässigt nummer som lägger grunderna för din bild, kan man säga. Om du till exempel skapar en bild som du tycker är okej men som du vill förbättra eller förändra, så behöver du använda samma seed. Använder vi till exempel exakt samma inställningar som när vi skapade den första bilden, fast med en annorlunda seed så får vi till exempel den här bilden.
Här använde jag följande seed: 610348621073340
Du kan kopiera min seed, och få nästan exakt samma bild själv.
control_after_generate har 4 olika inställningar:
Fixed – seed ändras inte mellan bilderna du skapar. Detta är som sagt nödvändigt om du vill skapa samma bild flera gånger.
Increment – Efter varje bild du skapar så ökar din seed med 1.
Decrement – Efter varje bild du skapar så minskar din seed med 1.
Randomize – En helt ny slumpmässig seed skapas för varje bild.
Steps kan förklaras ungefär med hur många gånger en bild ska förändras innan den är klar. 20 steps innebär alltså att bilden förändras, eller samplas, 20 gånger. Det är lätt att tro att ju högre denna siffran är, desto bättre blir bilden. Detta stämmer inte. Väldigt mycket beror på vilken modell man använder, och vissa modeller skapar mycket bra bilder på bara 10-15 steps medan andra behöver 100 steps.
Cfg är en skala som talar om hur nära din bild ska vara det du beskriver i texten. Högre värde innebär att bilden ska ha högre likhet med din text, och ett lägre värde innebär att likheten inte behöver vara så nära.
Sampler_name är den algoritm du väljer att använda för att förändra, eller sampla, din bild. Precis som det finns olika checkpoints som är bra för olika ändamål, så finns en uppsjö av samplers med.
Scheduler är ett typ av schema, precis som det låter, som talar om på vilket sätt bilden ska förändras. Om man tänker sig precis när du börjar skapa en ny bild, så är allt egentligen bara gryniga pixlar (detta ser vi aldrig). Målet är att filtrera bort grynigheten så att en klar bild framträder.
För varje step blir bilden mindre grynig, och när alla steps är slut ska grynigheten vara borta. Vid fler steps är det färre gryniga pixlar som tas bort per steg, kan man i princip säga.
Sampler är den matematiska formlen som talar om hur mycket grynighet som ska tas bort och är beroende av scheduler för att veta hur mycket grynighet som ska tas bort i varje step. Bilden nedan visar ett exempel med två olika schedules utförda med samma sampler.
Även om båda till slut hamnar på 0 så tar de bort olika mycket grynighet per steg.
Denoise är inte helt lätt att förklara, men i korthet kan man säga att ett högre värde ger större utrymme för kreativitet och ett lägre värde ger mer detaljerade bilder. Det bästa är att pröva sig fram för att se skillnaden.
VAE Decode och Save Image
VAE står för variational autoencoder och hjälper till att koda och avkoda dina bilder, vilket gör dem antingen lite skarpare eller lite mjukare. Save image visar här egentligen bara en preview av den bilden som sparats i din output folder.
Det här inlägget blev mycket längre än jag hade tänkt från början, och då har jag ändå bara tagit upp det mest grundläggande. Som jag skrivit tidigare så kommer jag göra fler inlägg (eller åtminstone ett till) där jag tar upp hur man skapar egna streams och skalar upp bilder, har jag tänkt.
Du kan prenumerera på nyhetsbrev genom att ange din mejladress här nedan, och på så sätt få ett mejl när det finns nya inlägg.