Annika Kumar 是 InGenius Prep 的研究生教練,目前正在杜克大學生物醫學工程系攻讀碩士學位。她在華盛頓大學完成了本科學習,主修生物工程和數據科學選項。在她的本科學習過程中,Annika 通過參加利用 MATLAB 和 Python 等工具對生物系統進行建模的課程,在計算生物工程方面打下了堅實的基礎。她還獲得了統計學和機器學習概論方面的知識。這些課程點燃了她對計算生物工程的熱情,並促使她進行了兩次暑期實習。
在實習期間,Annika 磨練了她的 Python 和 RStudio 技能,並獲得了使用大型數據集和機器學習模型的實踐經驗。在系統生物學研究所 (ISB),她處理了密集的基因組數據雲,專注於計算大約 1,700 人的多基因風險評分 (PRS)。她使用 Python 程式從 Arivale 數據集中提取基因組數據並計算 PRS,並利用 RStudio 可視化風險評分的分佈。此外,她還使用 Python 進行了類比,以評估數據量對 PRS 的影響,並在 RStudio 中可視化結果。
她的第二次實習是在 FDA 國家毒理學研究中心 (NCTR),在那裡她進行了一項研究,以評估訓練數據集樣本量對預測艾姆斯致突變性測試結果的模型性能的影響。她使用定量結構活性關係 (QSAR) 模型,並使用五種不同的機器學習演算法(邏輯回歸 (LR)、KNN、SVM、隨機森林和 XGBoost)訓練模型,使用馬修斯相關係數 (MCC) 評估性能。這次實習為她提供了進行機器學習研究的全面經驗,從數據清理和研究設計到模型訓練、參數優化和性能評估。
自從在杜克大學攻讀碩士學位以來,Annika 一直在 Big Ideas Lab 的研究中做出貢獻,專注於使用智慧手錶數據和機器學習來開發糖尿病、COVID-19 和流感等疾病的數位生物標誌物。她在霍夫曼實驗室的工作涉及應用機器學習模型和類比來分析圖像數據和研究蛋白質相互作用。Annika 熱衷於從事用於生物系統建模的機器學習研究事業。