بایگانی‌های هوش مصنوعی جمینای

گوگل نسخه تازه ابزار تصویرساز جمینای را عرضه کرد

کسب وکار

گوگل نسخه تازه ابزار تصویرساز جمینای را اراعه کرد_سیاه پوش

نوشته شده در شهریور ۶, ۱۴۰۴ توسط مریم ملکی

[ad_1]
نوشته و ویرایش شده توسط مجله سیاه پوش

گوگل با اراعه نسخه تازه ابزار تشکیل عکس جمینی اِی‌آی که با اسم رمز Nano Bananas سروصدای بسیاری به پا کرد، فتوشاپ را به چالش کشیده است. این ارتقا که به طور فنی Gemini 2.5 Flash Image نام دارد، به کاربران اجازه می‌دهد تصاویر را از طریق دستورات متنی و صوتی تشکیل کنند، از جمله جایگزینی افراد در یک عکس، تحول لباس آن‌ها، یا ترکیب افراد از تصاویر واقعی با بعد‌عرصه‌های تازه. گوگل این قابلیت را به طور رسمی روز سه‌شنبه، تنها از طریق اپلیکیشن موبایل جمینی انتشار کرد و نسخه وب تا این مدت به همه ویژگی‌های تازه دسترسی ندارد. ما این موتور تازه را آزمایش کرده‌ایم و نتایج آن زیاد دیدنی است. برای مثال، اورام پیلچ، سردبیر رج در ایالات متحده، عکسی از بالاتنه خود و یک عکس جداگانه از دو صندلی تهیه کرد. او هر دو عکس را در تلفن خود به جمینی داد و از موتور خواست او را در صندلی قرمز بنشاند.

به نقل از قسمت نوآوری رسانه اخبار تکنولوژی تکنا، جمینی نه تنها پیلچ را در صندلی قرمز قرار داد، بلکه برای او دست و پاهایی که در عکس مهم بالاتنه وجود نداشتند نیز کشید. این ابزار حتی لوگوی روی تی‌شرت او را که تنها نیمی از آن در عکس مهم دیده می‌شد، کامل کرد. تنها مسئله غیرواقعی در عکس ادغام‌شده، شلوار او می بود که مشکی می بود، در حالی که در حقیقت او یک شلوار جین آبی پوشیده می بود. او از جمینی خواست شلوار را به جین آبی روشن تحول دهد، و این کار بدون هیچ مشکلی انجام شد.

گوگل در این باره خبرداد که کافی است یک عکس به جمینی بدهید و به آن بگویید چه چیزی را تحول دهد تا نمود منحصر به فرد خود را اضافه کنید. جمینی به شما امکان می‌دهد عکس‌ها را با هم ترکیب کرده تا خودتان را در عکسی با حیوان خانگی‌تان قرار دهید، بعد‌عرصه یک اتاق را برای دیدن کاغذ دیواری تازه تحول دهید یا خودتان را در هر کجای دنیا که فکر می‌کنید، جای دهید. هنگامی که کارتان همه شد، می‌توانید عکس ویرایش‌شده جدیدتان را مجدد به جمینی آپلود کنید تا آن را به یک ویدیوی دلنشین تبدیل کنید.

در آزمایش‌های دیگر، پیلچ عکسی از دخترش گرفت و خواست دو مجسمه کنار او حذف شوند. مجسمه‌ها ناپدید شدند و سایه درختی نزدیک به جایی که قبلاً بودند، گسترش یافت. سپس او از جمینی خواست که دخترش در روبه رو اهرام ظاهر بشود و این ابزار به خواسته او عمل کرد. حتی حالت ایستادن دختر را تحول داد تا صاف‌تر بایستد. یکی از بهبودهای مهم که کاربران فوراً فهمید آن خواهند شد، شدت بالای این ابزار است. در آزمایش‌ها، تصاویر در عرض چند ثانیه آماده می‌شدند.

همه کار در فضای ابری صورت می‌گرفت و حتی عکس روی جلد این متن نیز با منفعت گیری از جمینی ساخته شد. جمینی توانایی واقعی خود را در این عرصه مشخص می کند که به ویرایشگران عکس اجازه می‌دهد با منفعت گیری از هوش مصنوعی در عرض چند ثانیه کارهایی را جانشین کنند که امکان پذیر ساعت‌ها یا حداقل دقایق طویل از یک طراح گرافیک زمان بگیرد. جایی که قبلاً باید یک نفر را با فتوشاپ در یک عکس قرار می‌دادید، اکنون می‌توانید فقط از ابزار بخواهید که این کار را برای شما انجام دهد.

گوگل یک واترمارک SynthID را برای امکان شناسایی تصاویر تشکیل شده توسط هوش مصنوعی در این سیستم گنجانده است که پشتیبانی بزرگی به افت تصاویر جعلی برای هرزنامه، تحریک یا دیگر اهداف مخرب خواهد می بود. یقیناً این نوشته مانع از هجوم موجی از هرزنامه‌های تشکیل شده توسط هوش مصنوعی به صندوق ورودی ایمیل شما نخواهد شد، اما حداقل برخی بازدید‌های ایمنی را فراهم می‌کند. جمینی ۲.۵ فلش ایمیج تا این مدت برخی حفاظ‌ها را دارد، هرچند که محدود می باشند.

برای مثال، تشکیل تصاویر هیتلر دشوار است، اما غیرممکن نیست. با این حال، اگر سلبریتی‌هایی همانند تیلور سوئیفت یا دونالد ترامپ را بخواهید، مشکلی نخواهید داشت. خوشبختانه این ابزار در روبه رو تشکیل تصاویر پورنوگرافیک، حفاظ‌های ملزوم را دارد. به طور کلی، با این که برخی تصاویر کیفیت ایده‌آل نداشتند، این ابزار هم چنان رقیب با لیاقت‌ای برای دیگر ابزارهای طراحی عکس LLM از اوپن‌ای‌آی یا xAI است. گوگل سیستم تازه خود را برای API جمینی، گوگل اِی‌آی استودیو برای گسترش‌دهندگان و ورتکس اِی‌آی با هزینه ۳۰ دلار به ازای هر یک میلیون نشانه‌ خروجی اراعه می‌کند که هر عکس برابر با ۱۲۹۰ نشانه‌ خروجی است (۰.۰۳۹ دلار برای هر عکس). گوگل اظهار کرده این نسخه یک نسخه موقت است و بهبودهای بیشتری در راه است. این شرکت این چنین با OpenRouter.ai و fal.ai برای دسترسی زیاد تر به این فناوری شریک شده است و اکنون نوبت دیگر شرکت‌های هوش مصنوعی است که با قابلیت‌های زیاد دلنشین تازه گوگل رقابت کنند.

دسته بندی مطالب

[ad_2]

تکنولوژی

گمان همکاری اپل و گوگل برای تحکیم Siri با قوت جمینای_سیاه پوش

نوشته شده در شهریور ۶, ۱۴۰۴ توسط مریم ملکی

[ad_1]
نوشته و ویرایش شده توسط مجله سیاه پوش

سهام شرکت آلفابت گوگل روز جمعه بعد از انتشار کردن گزارشی مبنی بر مذاکره اولیه اپل با گوگل برای منفعت گیری از مدل‌های هوش مصنوعی Gemini در نسخه به‌روزرسانی‌شده Siri با رشد بیشتر از سه درصد مواجه شد.

به نقل از قسمت بین الملل رسانه اخبار تکنولوژی تکنا، اپل در هفته‌های تازه از گوگل درمورد امکان گسترش یک مدل اختصاصی پرس‌وجو کرده است؛ مدلی که بتواند سیری را از نو بازتعریف کند و به گمان زیاد سال آینده در آیفون اراعه بشود. در حالی که مدل‌های پیشرفته Gemini طی ماه‌های تازه جایگاه بالایی در برسی‌های کلیدی هوش مصنوعی پیدا کرده‌اند، اپل تا این مدت موفق نشده است استراتژی روشنی برای آینده این حوزه اراعه کند و همین امر جهت شده نگاه‌ها به همکاری احتمالی دو شرکت جلب بشود.

این مذاکرات در شرایطی گزارش شده که Google با چالش‌های حقوقی مربوط به قراردادهای پرسود جست‌وجو با اپل مواجه است. انتظار می‌رود یک قاضی آمریکایی در ماه جاری درمورد جریمه‌های احتمالی علیه گوگل به علت انحصار در بازار جست‌وجو تصمیم‌گیری کند. وزارت دادگستری ایالات متحده نظر داده است که این شرکت از عقد قراردادهای انحصاری با طرف‌های ثالث منع بشود. برای گوگل این نوشته به‌طور مستقیم جایگاه موتور جست‌وجوی این شرکت روی آیفون و دستگاه‌های سامسونگ را تحت تأثیر قرار می‌دهد، قراردادهایی که سالانه میلیاردها دلار هزینه برای گوگل دارد.

گوگل پیش‌تر اظهار کرده می بود که مدل‌های جمینای به دستیار پیش‌فکر تلفنهای اندروید تبدیل خواهند شد. این شرکت امسال توانمندیهایی از Gemini به نمایش گذاشته است که فراتر از قابلیت‌های سیری است، از جمله امکان خلاصه‌سازی ویدیوها. از نظر دیگر Craig Federighi که مدیریت سیستم‌عامل‌های اپل را برعهده دارد سال قبل در کنفرانس گسترش‌دهندگان اشاره کرده می بود که این شرکت تصمیم دارد مدل‌های هوش مصنوعی متنوعی را برای اهداف اشکار در چارچوب Apple Intelligence به کار گیرد. او به طور خاص از Google نیز نام برد و گفت که جمینای اکنون قادر است با کاربران مکالمه کند و ورودی‌هایی از عکس، ویدیو، صدا و متن را پردازش کند. گزارش فرد دیگر در ماه ژوئن نیز حاکی از آن می بود که اپل علاوه بر گوگل در حال بازدید همکاری با Anthropic و OpenAI برای ترسیم مجدد نقشه راه خود در حوزه هوش مصنوعی است.

مدارکی که در جریان رسیدگی به پرونده انحصار گوگل انتشار شد نشان می‌داد مدیران اپل نیز در مذاکرات مربوط به منفعت گیری از جمینای برای یک گزینه احتمالی جست‌وجو نقش داشته‌اند. این نوشته اهمیت استراتژیک همکاری‌های احتمالی بین این دو غول فناوری را بیشتر از پیش آشکار می‌کند، چون اپل از یک سو به جستوجو تحکیم سیری و بازتعریف نقش آن در اکوسیستم آیفون است و از نظر دیگر گوگل می‌کوشد ضمن نگه داری جایگاه خود در بازار جست‌وجو، نفوذ مدل‌های هوش مصنوعی Gemini را گسترش دهد.

دسته بندی مطالب

[ad_2]

کسب وکار

صدمه‌پذیری Gemini از تزریق مخفی دستورات با تصاویر کوچک‌سازی‌شده_سیاه پوش

نوشته شده در شهریور ۵, ۱۴۰۴ توسط مریم ملکی

[ad_1]
نوشته و ویرایش شده توسط مجله سیاه پوش

پژوهشگران امنیتی شرکت Trail of Bits اظهار کرده‌اند ابزارهای مبتنی بر Gemini در برابر حملات مبتنی بر مقیاس‌گذاری عکس صدمه‌پذیر می باشند. این دعوا یکی از چالش‌های شناخته‌شده در حوزه یادگیری ماشین محسوب می‌بشود که پیش‌تر نیز در مقالات علمی مورد او گفت و گو قرار گرفته می بود.

به نقل از قسمت امنیت رسانه اخبار فناوری و تکنولوژی تکنا، گوگل این مشکل را یک صدمه‌پذیری امنیتی به شمار نمی‌آورد چون تنها در شرایطی ابراز می‌کند که پیکربندی غیرپیش‌فکر در سیستم اعمال شده باشد. مبنا این حملات بر تزریق دستورهای مخفی درون عکس است؛ دستورهایی که با دستکاری مقیاس‌گذاری توسط الگوریتم‌های خاص آشکار خواهد شد، در حالی که در حالت عادی برای چشم انسان نامرئی باقی می‌همانند. پژوهشگران توضیح دادند اگر کاربری تصویری آلوده را در یک سرویس صدمه‌پذیر بارگذاری کند، مدل هوش مصنوعی پنهانی از این دستورها پیروی کرده و می‌تواند داده‌ها را افشا کند.

به حرف های متخصصان سایبری، این دعوا وقتی موفق عمل می‌کند که سامانه‌های هوش مصنوعی به طور خودکار تصاویر بزرگ را کوچک‌سازی می‌کنند. آنها اشاره کردند که در فرآیند افت ابعاد عکس، دستورهای مخفی آشکار می‌بشود و به همین علت داده‌ها در معرض خروج غیرمجاز قرار می‌گیرند. برای اثبات این نوشته پژوهشگران ابزاری متن‌باز با نام Anamorpher گسترش دادند که قادر است تصاویر آلوده را بر پایه سه الگوریتم رایج کوچک‌سازی شامل nearest neighbor، bilinear و bicubic تشکیل کند. آنها موفق شدند این چنین حملاتی را نه تنها علیه Vertex AI با هسته جمینای بلکه در محیط‌های متنوعی همانند رابط وب جمینای، رابط برنامه‌نویسی API، Google Assistant روی تلفنهای اندرویدی و مرورگر Genspark نیز عملی کنند.

پژوهشگران پافشاری کردند که این دعوا نوعی تزریق غیرمستقیم محسوب می‌بشود چون کاربر از وجود متن مخرب در عکس خبری ندارد. تفاوت این دعوا با راه حلهایی همانند jailbreak در آن است که دستور مخرب به‌طور پنهانی و از طریق ورودی ترکیبی اعمال می‌بشود. شبیه این حرکت پیش‌تر در مرورگر Comet متعلق به Perplexity هم مشاهده شده می بود. مسئله مهم اینجاست که این چنین تزریق‌هایی به علت نهان‌بودن برای کاربر، نرخ پیروزی بالاتری نسبت به دیگر تکنیک‌ها دارند. آنها پیشنهاد کرده‌اند که در صورت منفعت گیری از کوچک‌سازی عکس در سامانه‌های عامل‌محور هوش مصنوعی، کاربر باید مدام پیش‌نمایشی از آنچه مدل می‌بیند دریافت کند تا در معرض دستورهای پنهانی قرار نگیرد.

گوگل در عکس العمل خبرداد که این صدمه‌پذیری تنها در صورتی رخ می‌دهد که کاربران پیکربندی غیرپیش‌فکر را فعال کنند. یک سخنگوی این شرکت گفت که مشکل یادشده به طور پیش‌فکر در Gemini CLI وجود ندارد و تنها وقتی امکان پذیر سوءاستفاده بشود که کاربر تنظیمات امنیتی همانند قبول خودکار فراخوانی MCP را تحول دهد و فایل آلوده را بدون کنترل داخل سیستم کند. به حرف های او گوگل ضمن سپاس از گزارش‌های جامعه امنیتی پافشاری دارد که گسترش‌دهندگان باید تنها به داده‌ها و فایل‌های مورد مطمعن دسترسی دهند و فعالیت‌های خود را در یک محیط ایزوله انجام بدهند. این چنین این شرکت خبرداد که به‌زودی هشدارهای صریح‌تری در ابزارهای خود برای کاربرانی که این حفاظ‌ها را غیرفعال می‌کنند اضافه خواهد کرد.

پژوهشگران Trail of Bits در آخر پافشاری کردند که سامانه‌های هوش مصنوعی به دفاع‌های ساختاریافته در برابر تزریق دستور نیاز دارند. آنها اعتقاد دارند که تنها با تکیه بر پیش‌نمایش یا ابزارهای کمکی نمی‌توان تهدید را رفع کرد بلکه باید راهکارهای جامع‌تری برای افت خطر این گونه حملات طراحی بشود تا مطمعن از ایمنی و کارایی ابزارهای مبتنی بر هوش مصنوعی در شرایط واقعی ضمانت گردد.

دسته بندی مطالب

[ad_2]

تکنولوژی

قولهای سبز گوگل در برابر حقیقت مصرف انرژی جمینای_سیاه پوش

نوشته شده در شهریور ۵, ۱۴۰۴ توسط مریم ملکی

[ad_1]
نوشته و ویرایش شده توسط مجله سیاه پوش

گوگل در مطالعه‌ای تازه ادعا کرده که مدل هوش مصنوعی Gemini برای هر سوال تنها مقدار زیاد اندکی انرژی و آب مصرف می‌کند. بر پایه داده‌های منتشرشده، مقدار مصرف آب برای هر خواست به طور میانگین معادل پنج قطره یا نزدیک به ۰.۲۶ میلی‌لیتر است و مقدار برق مصرفی نیز تقریباً برابر با تماشای ۹ ثانیه برنامه تلویزیونی یعنی چیزی نزدیک به ۰.۲۴ وات ساعت گفتن شده که نتیجه آن تشکیل تنها ۰.۰۰۳ گرم دی‌اکسیدکربن برآورد شده است.

به نقل از سرویس شبکه رسانه اخبار تکنولوژی تکنا، تعداد بسیاری از کارشناسان به شدت نسبت به صحت این ادعاها تردید نشان داده‌اند. نشریه The Verge گزارش داد که گوگل برخی داده‌های کلیدی را در این تحقیق نهان کرده و اثرات زیست‌محیطی مدل را به شکلی دیدنی کمتر از حقیقت نشان داده است. هرچند مراکز داده و مدل‌ها نسبت به قبل کارآمدتر شده‌اند اما شواهد مشخص می کند نوشته پیچیده‌تر از آن چیزی است که گوگل به عکس کشیده است و پشت پرده این آمار نکات مهمی نهان مانده است.

یکی از نویسندگان مقاله‌ای که در این مطالعه به آن استناد شده، Shaolei Ren استاد مهندسی برق دانشگاه کالیفرنیا به رسانه‌ها حرف های می بود که گوگل اطلاعات حیاتی را نهان کرده و این کار مطلب گمراه‌کننده‌ای به جهان منتقل می‌کند. حقیقت این است که مدل‌هایی همانند Gemini با حمایتمراکز داده عظیمی کار می‌کنند که انبارهایی مملو از سرورها می باشند و حجم بسیاری انرژی و آب مصرف می‌کنند و سختی سنگینی بر منبع های محلی داخل می‌سازند.

دولت‌ها در سراسر جهان با وجود نگرانی‌های زیست‌محیطی اجازه ساخت این چنین مراکزی را صادر می‌کنند، هرچند تخریب حاشیه شهرها و مناطق طبیعی را به جستوجو داشته باشد. در نهایت این مصرف‌کنندگان می باشند که باید بهای انرژی اضافی مصرف‌شده را بپردازند. یکی از بزرگ‌ترین ایرادها به نقل از گوگل این است که در برآوردها منفعت گیری غیرمستقیم از آب را لحاظ نکرده، در حالی که قسمت عمده مصرف واقعی در همین تکه است. اعداد اراعه‌شده اگرچه از نظر فنی درست می باشند اما حذف عرصه مصرف شدید انرژی تصویری گمراه‌کننده از حقیقت اراعه می‌دهد.

مطالعه گوگل تنها مقدار آبی را که مراکز داده برای خنک‌سازی سرورها منفعت گیری می‌کنند محاسبه کرده اما مصرف برق این مراکز که تبدیل احداث نیروگاه‌های گازی و هسته‌ای تازه می‌بشود در نظر گرفته نشده است. این نیروگاه‌ها نیز به سهم خود برای خنک‌سازی سیستم‌ها یا تشکیل بخار جهت چرخاندن توربین‌ها آب بسیاری مصرف می‌کنند. به این علت تأثیرات محیط زیستی زیاد فراتر از آن چیزی است که در این گزارش ذکر شده است.

آب تنها معیاری نیست که گوگل در آن کاستی داشته، چون در قسمت انتشار کردن کربن نیز فقطً از شاخصی مبتنی بر بازار منفعت گیری کرده که با تکیه بر قولهای این شرکت در خصوص منفعت‌گیری از انرژی‌های تجدیدپذیر رقم های را تعدیل کرده است. در همین عرصه Savannah Goodman مدیر Advanced Energy Labs توضیح داده می بود که مقصد آنها اراعه معیارهای زیست‌محیطی است که نماینده حرکت یک کاربر معمولی باشد و بتوان در طول زمان قیاس معقولی انجام داد، اما با دقت به تغییرات سریع معماری مدل‌های هوش مصنوعی و حرکت کاربران، در برخی موارد ناظر داده‌های غیرعادی از جمله خواست‌های کوچک یا خواست‌هایی با تعداد زیاد توکن هستیم.

او پافشاری کرد که برای اراعه معیاری پایدارتر و دقیق‌تر تصمیم گرفته‌اند داده‌های مربوط به سوال میانه را ملاک قرار دهند، چون این معیار نسبت به مقادیر افراطی مقاوم‌تر است و بازتاب واقع‌بینانه‌تری از تاثییر انرژی یک خواست عادی به شمار می‌آید.

دسته بندی مطالب

[ad_2]

برچسب: هوش مصنوعی جمینای

گوگل نسخه تازه ابزار تصویرساز جمینای را اراعه کرد_سیاه پوش

گمان همکاری اپل و گوگل برای تحکیم Siri با قوت جمینای_سیاه پوش

صدمه‌پذیری Gemini از تزریق مخفی دستورات با تصاویر کوچک‌سازی‌شده_سیاه پوش

قولهای سبز گوگل در برابر حقیقت مصرف انرژی جمینای_سیاه پوش