Na początku tego roku Open AI ujawniło swój najnowszy projekt - DALL-E. W najprostszym ujęciu jest to program komputerowy oparty o sztuczną inteligencję (GPT-3) który tworzy obrazy w oparciu o wprowadzony tekst.

Jest to nowe zastosowanie słynnego GPT-3, które w zeszłym roku zrobiło furorę generując teksty w języku naturalnym w oparciu o kilka promptów.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/7d9286f3-b620-4fc5-91bf-32a0bc89092a/148226716_10223173718426365_7551831954504678481_o.jpg

Tym razem granica została przesunięta dalej. DALL-E tworzy obraz z oparciu kilka słów kluczowych. W wersji dla przeciętnego użytkownika pozwala na zabawę kilkoma funkcjami i tworzenie mniej lub bardziej kreatywnych obrazków.

W bardziej poważnej aplikacji widzę jednak ocean możliwości jaki daje to oprogramowanie. Jesteśmy zwierzętami wzrokowymi, a nasze umysły są znacznie lepiej przystosowane do przetwarzania większości informacji w oparciu o bodźce wizualne. DALL-E daje możliwość pokazania drugiemu człowiekowi koncepcji, którą sobie wyobrażamy. Dokładnie. Szybko. Bez pola na niezrozumienie.

Okradziony człowiek może pokazać policjantowi jak wygląda złodziej kilka sekund po zdarzeniu. Przechodzień może opisać uraz ofiary wypadku lekarzowi dyżurnemu minutę po wypadku. Architekt może pokazać klientowi jak będzie wyglądał jego dom jeszcze w czasie pierwszego spotkania.

Z drugiej strony ta technologia może sprawić, że gra w kalambury straci wszelki urok. The choices we have to make...

Source: https://openai.com/blog/dall-e/