Annika Kumar目前正在杜克大学生物医学工程系攻读硕士学位。她在华盛顿大学完成了本科学业,主修生物工程和数据科学。在本科学习期间,Annika ,她利用 MATLAB 和 Python 等工具为生物系统建模,为计算生物工程打下了坚实的基础。她还学习了统计学知识和机器学习入门。这些课程点燃了她对计算生物工程的热情,并促使她进行了两次暑期实习。
在实习期间,Annika ,她磨练了自己的 Python 和 RStudio 技能,并获得了处理大型数据集和机器学习模型的实践经验。在系统生物学研究所(ISB),她处理了密集的基因组数据云,重点是计算约1700人的多基因风险评分(PRS)。她使用 Python 程序从 Arivale 数据集中提取基因组数据并计算多基因风险评分,还利用 RStudio 对风险评分的分布进行可视化。此外,她还使用 Python 进行了模拟,以评估数据量对 PRS 的影响,并在 RStudio 中将结果可视化。
她的第二份实习是在美国食品药物管理局国家毒理学研究中心(NCTR),在那里她开展了一项研究,评估训练数据集样本大小对预测艾姆斯诱变试验结果的模型性能的影响。她使用定量结构-活性关系 (QSAR) 模型,并使用五种不同的机器学习算法(逻辑回归 (LR)、KNN、SVM、随机森林和 XGBoost)训练模型,使用马修斯相关系数 (MCC) 评估性能。这次实习为她提供了开展机器学习研究的全面经验,从数据清理和研究设计到模型训练、参数优化和性能评估。
在杜克大学攻读硕士学位后,Annika 参与了大创意实验室(Big Ideas Lab)的研究工作,专注于利用智能手表数据和机器学习开发糖尿病、COVID-19 和流感等疾病的数字生物标记物。她在霍夫曼实验室的工作包括应用机器学习模型和模拟来分析图像数据和研究蛋白质相互作用。Annika 对从事机器学习生物系统建模的研究工作充满热情。