in

Google का व्हिस्क AI प्रायोगिक उपकरण अद्वितीय आउटपुट उत्पन्न करने के लिए छवियों को मैश-अप कर सकता है

Google ने सोमवार को एक नया प्रायोगिक कृत्रिम बुद्धिमत्ता (AI) टूल पेश किया जो अद्वितीय आउटपुट उत्पन्न करने के लिए छवियों को फ्यूज कर सकता है। डब्ड व्हिस्क, यह एक मज़ेदार उपकरण है जिसका इसके निर्दिष्ट फ़ंक्शन के बाहर कोई बड़ा अनुप्रयोग नहीं है। माउंटेन व्यू-आधारित तकनीकी दिग्गज ने हाल ही में जेनचेस जैसे कई ऐसे मज़ेदार एआई टूल जारी किए हैं, जो अद्वितीय शतरंज की बिसात के टुकड़े उत्पन्न करने के लिए इमेजन 3 एआई मॉडल का उपयोग करता है। व्हिस्क के साथ, कंपनी यह प्रदर्शित कर रही है कि कैसे एआई अद्वितीय कला उत्पन्न करने के लिए एक संकेत के रूप में केवल छवियों का उपयोग कर सकता है।

Google का व्हिस्क इनपुट छवियों को ‘रीमिक्स’ कर सकता है

में एक ब्लॉग भेजाटेक दिग्गज ने नया AI टूल पेश किया। व्हिस्क वर्तमान में केवल यूएस में उपलब्ध है, और इसे Google लैब्स के माध्यम से एक्सेस किया जा सकता है, जो कंपनी के देशी एआई मॉडल का उपयोग करके बनाए गए प्रायोगिक टूल जारी करने का प्लेटफॉर्म है। अन्य सभी टूल की तरह, व्हिस्क भी प्रयोगात्मक है और Google इस बात पर प्रकाश डालता है कि कभी-कभी यह उस तरह से प्रदर्शन नहीं कर पाता जैसा उपयोगकर्ता चाहते हैं।

एआई छवि जनरेटर काफी सामान्य हैं, हालांकि, उनमें से अधिकांश या तो केवल टेक्स्ट या टेक्स्ट और छवियों के मिश्रण को इनपुट के रूप में स्वीकार करते हैं। संक्षेप में, छवि निर्माण मॉडल को यह समझने के लिए कि क्या बनाना है, कुछ हद तक प्राकृतिक भाषा के संकेतों की आवश्यकता होती है। हालाँकि, व्हिस्क ऐसे मॉडलों से अलग है क्योंकि उपयोगकर्ता मॉडल को आउटपुट बनाने के लिए प्रेरित करने के लिए केवल छवियां जोड़ सकते हैं।

व्हिस्क उपयोगकर्ताओं को तीन छवियां जोड़ने के लिए कहता है – विषय, दृश्य और शैली के लिए एक-एक। एक बार जोड़ने के बाद, एआई टूल स्वचालित रूप से एक अद्वितीय छवि उत्पन्न करने के लिए दृश्य जानकारी को संसाधित करता है जो सभी तीन इनपुट छवियों का संयोजन है। आउटपुट उत्पन्न करने के लिए उपयोगकर्ता केवल दो छवियां भी जोड़ सकते हैं, एक विषय के लिए और दूसरी दृश्य के लिए।

Google ने बताया कि पर्दे के पीछे, जेमिनी मॉडल छवियों को संसाधित करता है और एक विस्तृत प्राकृतिक भाषा संकेत लिखता है, जिसे बाद में इमेजेन 3 मॉडल में फीड किया जाता है। प्रॉम्प्ट का उद्देश्य छवियों के सार को पकड़ना है और इनपुट छवियों का एक वस्तुनिष्ठ मिश्रण उत्पन्न करने का प्रयास नहीं करता है।

चूंकि व्हिस्क एक प्रायोगिक मॉडल है, इसलिए उत्पन्न छवियां उपयोगकर्ता की अपेक्षाओं से भिन्न हो सकती हैं। उपयोगकर्ताओं को आउटपुट पर अधिक नियंत्रण देने के लिए, व्हिस्क उपयोगकर्ताओं को पीढ़ी के बाद छवियों को परिष्कृत और संपादित करने देता है। उपयोगकर्ता जेमिनी द्वारा लिखे गए अंतर्निहित संकेत को आसानी से जांच सकते हैं और इसे बदल सकते हैं या वांछित परिणाम प्राप्त करने के लिए अधिक जानकारी जोड़ सकते हैं।

“हमने इसे तीव्र दृश्य अन्वेषण के लिए बनाया है, न कि पिक्सेल-परिपूर्ण संपादन के लिए। यह नए और रचनात्मक तरीकों से विचारों की खोज करने के बारे में है, जो आपको दर्जनों विकल्पों के माध्यम से काम करने और जो आपको पसंद है उसे डाउनलोड करने की अनुमति देता है, ”Google ने कहा।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्स, फेसबुक, WhatsApp, धागे और गूगल समाचार. गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें यूट्यूब चैनल. यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस को फ़ॉलो करें वह360 कौन है? पर Instagram और यूट्यूब.

माइक्रोसॉफ्ट के सीईओ सत्या नडेला ने सभी डिवाइसों पर एक्सबॉक्स गेम्स पर जोर दिया

Source link

What do you think?

Leave a Reply

Your email address will not be published. Required fields are marked *

GIPHY App Key not set. Please check settings

क्या परमाणु सचमुच स्पर्श करते हैं? विज्ञान उनकी जटिल अंतःक्रियाओं की व्याख्या करता है

वनप्लस 13आर का भारतीय वेरिएंट स्नैपड्रैगन 8 जेन 3 चिपसेट के साथ गीकबेंच पर दिखाई देता है