منفعت گیری از میلیونها ساعت ویدیوی یوتیوب برای آموزش GPT-4_سیاه پوش
نوشته و ویرایش شده توسط مجله سیاه پوش
گوگل خبرداد آموزش GPT-4 با منفعت گیری از یک میلیون ساعت ویدیوهای یوتیوب انجام گرفته است. به نظر میرسد شرکت OpenAI آموزش GPT-4 را با پشتیبانی ویدیوهای یوتیوب انجام داده است. گوگل تصمیم دارد با اتخاذ تدبیرها فنی و قانونی از این چنین منفعت گیریهای غیر مجازی جلوگیری کند.
به نقل از سرویس اخبار فناوری و تکنولوژی تکنا، گزارش انتشار شده توسط نیویورک تایمز مشخص می کند مدل صوتی Whisper در OpenAI به این شرکت پشتیبانی کرده تا بتواند میلیون ها ساعت از ویدیوهای یوتیوب را رونویسی کرده و از آن برای آموزش GPT-4 گسترش یافتهترین مدل زبانی بزرگ این شرکت منفعت گیری کند. اگرچه این شرکت جنبه قانونی منفعت گیری از این چنین دادههایی را می داند. اما معتقد است منفعت گیری از این دادهها را باید به طور منصفانه انجام داد.
شرکت های هوش مصنوعی برای آموزش مدلهای پیشرفته خود و گسترش آنها به دادههای تعداد بسیاری نیاز دارند. از طرفی تعداد بسیاری از آنها در یافتن این دادهها و منفعت گیری از آنها برای آموزش با کیفیت با مشکلاتی روبه رو شدهاند. مطابق گزارشهای تازه این مشکل علتشده تا تعداد بسیاری از این شرکتها به سمت ستفاده از دادههای شامل قانون کپی رایت هوش مصنوعی بروند. در این بین شرکت OpenAI و ویدیوهای یوتیوب نیز این چنین وضعیتی دارند.
پیش از این نیل موهان مدیرعامل یوتیوب هشدارهایی را در رابطه گمان منفعت گیری شرکت OpenAI از ویدیوهای یوتیوب برای آموزش هوش مصنوعی خود از قبیل SORA داده می بود. به حرف های وی از این بعد تدبیرها فنی و قانونی توسط گوگل اتخاذ خواهد شد تا مجدداً این چنین منفعت گیریهای غیر مجازی از نظر دیگر شرکت ها صورت نگیرد. به حرف های سخنگوی OpenAI آموزش مدلهای این شرکت با منفعت گیری از مجموعه دادههای منحصر به فرد نجام میبشود تا بتوان فهمیدن درستی از آنها تشکیل کرد. این چنین این شرکت مدعی است برای آموزشها از منبع های بسیاری همانند دادههای دسترسی عمومی و دادههای غیر عمومی منفعت گیری کرده است.
دسته بندی مطالب