همزمان با سروصدای زیادی که chatGPT توی دنیا راه انداخته است، محققان گوگل MusicLM رو معرفی کردند. مدلی که میتواند از روی متنی که بهش میدهیم موسیقی تولید کند! اینطور که گوگل ادعا کرده است MusicLM از سیستمهای قبلی هم در کیفیت صدا و هم در رعایت توضیحات متن بهتر عمل میکند.
برای حمایت از تحقیقات آینده، گوگل MusicCaps را بهطور عمومی منتشر میکند، مجموعه دادهای متشکل از ۵.۵ هزار جفت موسیقی-متن، با توضیحات متن غنی که توسط متخصصان انسانی ارائه شده است. البته به خاطر نگرانیهای کپیرایت، MusicLM قرار نیست فعلاً برای عموم منتشر بشود.
جالب است بدانید که این مدل حتی برای نقاشیهای معروف دنیا هم با توجه به توضیحاتشان موسیقی تولید کرده است! اینجا (https://google-research.github.io/seanet/musiclm/examples/) میتوانید نمونههایی از موسیقیای که توسط MusicLM تولید شده رو بشنوید. ضمناً مقالهی تحقیقاتی این مدل هم توی لینک زیر قابل دسترسی است:
➡️ https://arxiv.org/abs/2301.11325