Trid Diffużjoni Stabbli f'HD? Dan il-Ġeneratur tal-Arti tal-AI Jagħti

Il-ġeneraturi tal-immaġini tal-AI huma l-aqwa f'dawn il-jiem, iżda ħafna minnhom huma limitati għall-ħolqien ta 'immaġini b'riżoluzzjonijiet baxxi, jew il-hardware jispiċċa mingħajr memorja tal-vidjo. Issa hemm (mill-inqas) soluzzjoni waħda għal dan: verżjoni modifikata ta 'Stable Diffusion imsejħa "txt2imghd."
Il-proġett il-ġdid txt2imghd huwa bbażat fuq il-mod "GOBIG" minn off-shoot ieħor ta 'Stable Diffusion, li min-naħa tiegħu huwa l-mudell użat biex tinħoloq ħafna mill-arti AI li probabilment rajt dan l-aħħar. Immaġini maħluqa b'txt2imghd jistgħu jkunu akbar minn dawk maħluqa bil-biċċa l-kbira tal-ġeneraturi l-oħra — l-immaġini demo huma 1536 × 1536, filwaqt li Stable Diffusion ġeneralment tkun limitata għal 1024 × 768, u l-inadempjenza għal Midjourney hija 512 × 512 (b'upscaling fakultattiv għal 1664 x 1664).

Txt2imghd għandu mod għaqlija ta 'upscaling immaġini. Skont id-dokumentazzjoni tal-proġett, "joħloq immaġini dettaljati u b'riżoluzzjoni ogħla billi l-ewwel tiġġenera immaġni minn pront, tkabbarha, u mbagħad tħaddem img2img fuq biċċiet iżgħar tal-immaġni upscaled, u tħallat ir-riżultat lura fl-immaġni oriġinali." Hija ħidma għaqlija għal-limiti tal-kards tal-vidjo, iżda kif tista 'tistenna, ir-riżultat jieħu aktar żmien biex jiġġenera minn immaġni waħda b'riżoluzzjoni baxxa.
Il-verżjoni aġġornata għandha bejn wieħed u ieħor l-istess rekwiżiti tas-sistema bħal Stable Diffusion regolari, li tirrakkomanda karta grafika b'mill-inqas 10 GB ta 'memorja tal-vidjo (VRAM). Jekk int interessat li tipprovaha, tista’ tħaddem il-mudell fil-browser tiegħek (jeħtieġ kont GitHub b’xejn). Tista 'wkoll tniżżel il-kodiċi biex taħdem fuq il-kompjuter tiegħek mill-link tas-sors hawn taħt.
Sors: GitHub