21:09 – 27 اوت 1403
تیمی از محققان هوش مصنوعی در دانشگاه Tsinghua چین یک مدل زبان بزرگ به نام “LongWriter” ساخته اند که سازندگان ادعا می کنند قادر به تولید متن تا 10000 کلمه است. با توجه به اینکه مدل های رایج فعلی می توانند خروجی حدود دو هزار کلمه تولید کنند، LongWriter در زمینه نوشتن متون طولانی کارآمدتر خواهد بود. این مدل نیز متن باز است و توسعه دهندگان می توانند آن را بهبود بخشند.
طبق گزارش Tech Xplore، حداکثر خروجی متن برای مدلهای فعلی هوش مصنوعی حدود 2000 کلمه است. محققان حدس می زنند که دلیل آن این است که این مدل ها با محتوای کوتاه آموزش داده شده اند. محققان می خواستند بدانند اگر مدل خود را با استفاده از محتوای طولانی تر آموزش دهند، خروجی آنها طولانی تر می شود یا خیر.
AI LongWriter با خروجی 10000 کلمه
محققان برای آزمایش ایده خود، ابتدا یک مدل 9 میلیارد پارامتری را با استفاده از یک مجموعه داده معمولی حاوی کمتر از 2000 کلمه آموزش دادند. همانطور که انتظار می رفت، این مدل قادر به تولید متون بیش از 2000 کلمه در طول مکالمه نبود.
در مرحله بعد، محققان دادهها را جمعآوری کردند، مجموعهای به نام LongWriter-6k که شامل 6000 متن نوشته شده از 2000 تا 32000 کلمه بود. سپس آنها LLM خود را با استفاده از مجموعه داده جدید آموزش دادند و دریافتند که با انجام این کار، طول خروجی به حدود 10000 کلمه افزایش یافت.
این مدل جدید منبع باز است و در GitHub منتشر شده است. با استفاده از این مدل، کاربران بهتر می توانند مقاله، کتاب یا متون در زمینه های مختلف تولید کنند. البته با توجه به اینکه چنین مدلی می تواند یک اثر مکتوب کامل را تولید کند، محققان می گویند ملاحظات اخلاقی نیز باید در نظر گرفته شود.
چندی پیش OpenAI از مدل خروجی بلند GPT-4o رونمایی کرد که به کاربران اجازه می دهد پاسخ های طولانی به اندازه یک رمان 200 صفحه ای دریافت کنند.
منبع: دیجیاتو
منبع: https://www.yjc.ir/fa/news/8802171/%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D8%AC%D8%AF%DB%8C%D8%AF%DB%8C-%DA%A9%D9%87-%D9%85%DB%8C%E2%80%8C%D8%AA%D9%88%D8%A7%D9%86%D8%AF-%D9%85%D8%AA%D9%86%E2%80%8C%D9%87%D8%A7%DB%8C-%DB%B1%DB%B0-%D9%87%D8%B2%D8%A7%D8%B1-%DA%A9%D9%84%D9%85%D9%87%E2%80%8C%D8%A7%DB%8C-%D8%AA%D9%88%D9%84%DB%8C%D8%AF-%DA%A9%D9%86%D8%AF