fbpx
ברווז גומי עם משקפי שמש | צילום מסך | DALL·E mini

העתיד כבר כאן: הכירו את הבינה המלאכותית שיוצרת יש מאין

דמיינו שיש תוכנה שיכולה להחיות את החלומות שלכם, לייצר תמונה מאפס וכל זה בעזרת תיאורים בלבד.

  • תמר ברין
  • 22 ביוני, 2022

המאה ה-21 הביאה איתה המון חידושים טכנולוגיים מרתקים, אבל דבר כזה טרם ראינו.

הכירו את DALL·E – תוכנת בינה מלאכותית שיוצרת תמונות מתיאורים טקסטואליים. השם שלה הוא הלחם בסיסים של דאלי (הצייר סלבדור דאלי) ושל וול-E (הרובוט החמוד של פיקסאר). התוכנה משתמשת בכ-12 מיליארד פרמטרים בגרסה של מודל ה-GPT-3 (מודל שפה המשתמש בלמידה עמוקה כדי לייצר טקסט דמוי אנושי) כדי לפרש קלט טקסטואלי משפה טבעית, כמו "שפן צהוב מתנדנד על נדנדה" – וליצור תמונות בהתאם. היא יכולה ליצור דימויים של חפצים ריאליסטיים כגון "חלון ויטראז' עם תמונה של תות ורוד" וגם של חפצים שאינם קיימים במציאות כמו "קובייה במרקם של כבשה". משנות ה-2000 ועד היום, בינות מלאכותיות רבות הצליחו ליצור תמונות מציאותיות, אך מה שמייחד את DALL-E הוא העובדה שהיא מסוגלת לייצר אותן על בסיס הנחיות בשפה טבעית.

חלון ויטראז' עם תמונה של תות ורוד | צילום מסך | DALL·E mini

 

DALL-E מסוגלת ליצור דימויים במגוון סגנונות, מתמונות פוטו-ריאליסטיות ועד לציורים ואפילו אימוג'י. היא מסוגלת לבצע מניפולציות ולסדר מחדש אובייקטים בתמונות. אחת היכולות שצוינו על ידי יוצריה הייתה המיקום הנכון של אלמנטים עיצוביים בקומפוזיציות ללא הוראה מפורשת: לדוגמה, כאשר רושמים לתוכנה לצייר "צנון רוכב על חד אופן" DALL-E מצייר לעיתים קרובות רגליים במקומות סבירים. תוצאות ההדגמה של DALL-E הראו שהיא מסוגלת "למזג מושגים באופן מאורגן היטב לוגית או אסתטית", מרכיב מפתח ביצירתיות אנושית וכי התוכנה מדגימה באופן יוצא דופן יצירת איורים שהם הרבה יותר מובנים ממערכות אחרות בשנים האחרונות. מארק רידל, פרופסור בבית הספר למחשוב אינטראקטיבי של ג'ורג'יה טק, צוטט על ידי ה-BBC שהוא "התרשם ממה שהמערכת יכולה לעשות". בעיקר מהיכולת של DALL-E להשלים את החסר ולהציג הבנה רחבה של מגמות חזותיות ועיצוביות.

איך הכל התחיל?

ב-5 בינואר 2021 DALL-E נחשף על ידי OpenAI – חברה אמריקאית למחקר בינה מלאכותית, אשר שואפת לפתח בינה מלאכותית ידידותית לתועלת המין האנושי.

לא מפסיקים להתחדש

באפריל 2022, OpenAI הכריזה על DALL-E 2 בטענה שהיא יכולה להפיק תמונות פוטו-ריאליסטיות מתיאורים טקסטואליים, יחד עם עורך המאפשר שינויים. נכון לעכשיו, נאמר שהתוכנה עדיין נמצאת בשלב המחקר, כשהגישה מוגבלת למשתמשי בטא שנבחרו מראש. המודל עדיין יכול לעשות טעויות חמורות, כולל טעויות שאף אדם לא יעשה. DALL-E 2 תואר כי הוא "יכול ליצור תמונות מקוריות וריאליסטיות מתיאור של טקסט. הוא יכול לשלב מושגים, תכונות וסגנונות."

DALL-E 2 מסוגל ליצור תמונות הרבה יותר מציאותיות מה-DALL-E המקורי, כמו כלב שיבה בכומתה ובצווארון גולף:

Greg Brockman | צילום מסך מתוך Twitter

בין אם אתם חובבי אמנות, טכנולוגיה או סתם סקרנים, ניתן להשתמש בגרסה החינמית ולנסות את הפלא בעצמכם – https://huggingface.co/spaces/dalle-mini/dalle-mini.

עם השנים הטכנולוגיה מגיעה לשיאים חדשים ויש אפילו כאלו שאומרים שהבינות המלאכותיות עוד ישתלטו על העולם. אבל עד שזה יקרה, נוכל להשתמש בזה לטובתנו. האם הייתם משתמשים בתוכנה בכדי להחיות תמונות מן הדמיון שלכם? עכשיו יש לכם את האפשרות!