أثبت باحثون في كلية الطب بجامعة كاليفورنيا في سان دييغو أن النماذج اللغوية الكبيرة (LLMs)، مثل GPT-4، يمكن أن تساعد في أتمتة أبحاث الجينوم الوظيفية، التي تسعى إلى تحديد وظيفة الجينات وكيفية تفاعلها. يهدف النهج الأكثر استخدامًا في علم الجينوم الوظيفي، والذي يسمى إثراء مجموعة الجينات، إلى تحديد وظيفة مجموعات الجينات المحددة تجريبيًا من خلال مقارنتها بقواعد بيانات الجينوم الموجودة. ومع ذلك، فإن علم الأحياء الأكثر إثارة للاهتمام والجديد غالبًا ما يكون خارج نطاق قواعد البيانات المعمول بها. إن استخدام الذكاء الاصطناعي (AI) لتحليل مجموعات الجينات يمكن أن يوفر على العلماء ساعات عديدة من العمل المكثف ويقرب العلم خطوة واحدة من أتمتة إحدى الطرق الأكثر استخدامًا لفهم كيفية عمل الجينات معًا للتأثير على علم الأحياء.
ومن خلال اختبار خمسة نماذج مختلفة من LLM، وجد الباحثون أن GPT-4 كان الأكثر نجاحًا، حيث حقق معدل دقة قدره 73٪ في تحديد الوظائف المشتركة لمجموعات الجينات المنسقة من علم الجينوم الشائع الاستخدام.