ระบบสร้างข้อความเป็นเพลงด้วย AI ใหม่ของ Google MusicLM ได้รับการฝึกอบรมในชุดข้อมูล 2,80,000 ชั่วโมง และ AI สามารถรับคำสั่งจากเครื่องดนตรี อารมณ์ และทำนองเพื่อเปลี่ยนข้อความเป็นเพลง MusicLM ไม่จำกัดเพียงแค่ข้อความเท่านั้น คุณยังสามารถแจ้ง MusicLM AI ในรูปแบบของรูปภาพและคำบรรยาย Google กล่าวว่าระบบนี้สร้างขึ้นจากการแต่งเพลงและท่วงทำนองเครื่องดนตรีตามคำอธิบายของ “ความซับซ้อนที่สอดคล้องกัน” แม้ว่า MusicLM AI โดย Google จะฟังดูดี แต่ก็ยังมีอะไรมากกว่านั้น รายละเอียดเพิ่มเติมอยู่ด้านล่าง
เครื่องมือ AI ใหม่ของ Google สามารถสร้างเพลงจากคำอธิบายข้อความสั้นๆ
นักวิจัยของ Google ได้สร้าง AI ที่สามารถสร้างชิ้นดนตรีที่มีความยาวหลายนาทีจากข้อความแจ้ง และยังสามารถแปลงเสียงผิวปากหรือฮัมเพลงเป็นเครื่องดนตรีอื่นๆ ได้ คล้ายกับวิธีที่ระบบอย่าง DALL-Eสร้างภาพจากข้อความแจ้ง ( ผ่านTechCrunch ) โมเดลนี้มีชื่อว่า MusicLM และแม้ว่าคุณจะไม่สามารถลองเล่นด้วยตัวคุณเองได้ บริษัทได้อัปโหลดตัวอย่างจำนวนมากที่ผลิตขึ้นโดยใช้โมเดลดังกล่าว
MusicLM สามารถจำลองเสียงร้องของมนุษย์ได้ และแม้ว่าดูเหมือนว่าจะได้โทนเสียงและเสียงโดยรวมที่ถูกต้องแล้ว แต่ก็มีคุณภาพสำหรับเสียงเหล่านั้นที่ผิดเพี้ยนไปอย่างแน่นอน วิธีที่ดีที่สุดที่ฉันสามารถอธิบายได้คือเสียงเหล่านี้เป็นเม็ดเล็กหรือคงที่ คุณภาพนั้นไม่ชัดเจนในตัวอย่างด้านบน แต่ฉันคิดว่าคุณภาพนี้แสดงให้เห็นได้ค่อนข้างดี
AI ยังสามารถสร้างซาวด์แทร็กที่ยาวขึ้นพร้อมข้อความสั้นๆ เช่น “เทคโนไพเราะ” หรือ “ดนตรีแจ๊สที่ผ่อนคลาย” ซึ่งใช้เวลานานถึงห้านาที มันสามารถแปลงเรื่องเล่าสั้น ๆ หรือคำอธิบายภาพวาดให้เป็นเพลงได้ ตัวอย่างเช่น เพลงนี้ได้สร้างท่วงทำนองที่น่าสนใจโดยอิงจากเพลง”Napoleon Crossing the Alps” ของ Jacques-Louis Davidและ”The Scream” ของ Edvard Munch
Google ได้ฝึกฝน MusicLM เกี่ยวกับเนื้อหาดนตรีที่มีลิขสิทธิ์อยู่แล้ว ดังนั้นจึงไม่น่าแปลกใจที่ประมาณ 1% ของตัวอย่างสามารถเชื่อมโยงกับเพลงที่มีอยู่ได้ นักวิจัยตั้งข้อสังเกต สิ่งนี้อาจสร้างความกังวลเกี่ยวกับความสามารถของ MusicLM ในการยกเนื้อหาที่มีลิขสิทธิ์ที่มีอยู่มาสร้างเพลงของตัวเองได้อย่างง่ายดาย
ด้วยเหตุนี้ Google จึงไม่ได้วางแผนที่จะเผยแพร่โมเดลนี้สู่สาธารณะในเร็ว ๆ นี้ ต้องบอกว่า บริษัทได้จัดทำคู่ข้อความเพลง 5,500 คู่สำหรับทุกคนที่ต้องการดูและฟัง MusicLM ทำกลอุบายอย่างไร ชุดข้อมูลนี้เรียกว่า “MusicCaps” พร้อมใช้งานแล้วบนหน้า Github ของ Googleและแสดงข้อความแจ้งและผลลัพธ์เสียงเคียงข้างกัน
บทความโดย : ufa168