Richard Li partage ce qui ressemble à travailler en tant que statisticien informatique principal dans le laboratoire d’IA avancé de Genuity Science.
Après avoir obtenu un doctorat en chimie physique, Richard Li est entré dans un poste au sein de Genuity Science, une société de génomique examinant de grandes bases de données génétiques.
Ce travail a récemment vu Li participer à un projet de recherche sur l’apprentissage automatique quantique qui a été publié par la revue en libre accès Patterns.
Nous avons parlé à Li du rôle d’un statisticien informatique senior dans le laboratoire avancé d’IA de Genuity Science, pour voir si tout s’est mis en place après avoir quitté l’université et découvrir les points forts de son parcours professionnel jusqu’à présent.
« Comprendre quand et quand ne pas utiliser les techniques de calcul sera la clé pour conduire de nouvelles découvertes »
– RICHARD LI
S’il y a une telle chose, pouvez-vous décrire une journée typique dans la vie d’un statisticien informaticien chez Genuity Science?
Dernièrement, une journée typique a été de suivre l’avancement de diverses analyses et de préparer des présentations pour informer les collaborateurs sur les projets sur lesquels nous travaillons. Si j’ai le temps, j’essaye de développer de nouveaux outils et méthodes de calcul pour notre groupe. Notre groupe soumet le travail que nous avons fait à des revues à comité de lecture, donc il y a beaucoup d’écriture à faire et des chiffres faits, selon la phase du projet.
Sur quel genre de projets travaillez-vous?
Les projets varient un peu, mais mon rôle est principalement de (tenter de) dériver de nouvelles connaissances biologiques en appliquant des algorithmes d’apprentissage automatique et d’apprentissage en profondeur. J’ai surtout récemment travaillé sur un projet impliquant Covid-19 et un autre impliquant l’effet du vieillissement sur le cerveau.
J’ai également travaillé avec diverses approches informatiques non conventionnelles. Nous avons récemment conclu un projet d’apprentissage automatique quantique avec l’Université de Californie du Sud où nous avons appliqué des algorithmes quantiques et inspirés du quantique pour classer différentes classes et sous-types de cancer. Le travail a été récemment accepté et publié en ligne à la fin du mois d’avril 2021 et figurera sur la couverture du numéro imprimé de Patterns en juin.
Quelles compétences utilisez-vous au quotidien?
Probablement une combinaison de compétences techniques et de compétences en communication. Je fais beaucoup de programmation en R et Python, ainsi que des scripts Bash pour les projets de recherche et les analyses que nous faisons. Parfois, quelques maths.
Une grande partie de notre travail est hautement collaborative, ce que j’aime. Pas seulement au sein de l’entreprise, mais aussi avec des collaborateurs externes, je dois donc régulièrement faire des présentations.
Quelle est la partie la plus difficile de votre journée de travail?
Probablement juste après avoir fait une présentation. Je pourrais être décrit comme un introverti extraverti, je dois donc me ressourcer un peu après avoir fait une présentation, mais je n’ai peut-être pas le temps.
Avez-vous des conseils de productivité qui vous aideront tout au long de votre journée?
Pauses collations! Et passer de la position assise à la position debout.
Lorsque vous avez commencé chez Genuity Science, qu’est-ce qui vous a le plus surpris d’apprendre était important dans le rôle?
Peut-être la quantité de travail nécessaire au prétraitement des données. Je suis venu directement de mon doctorat et j’ai principalement travaillé avec des ensembles de données bien organisés et «désinfectés». Les données réelles peuvent être beaucoup plus compliquées.
Bien que j’aie une connaissance générale de la biologie moléculaire grâce à des cours, je ne suis pas un expert en biologie. On a beaucoup appris sur ce qui se passe «sous le capot», pour ainsi dire.
Chaque ensemble de données étant différent, les outils et les techniques devront peut-être être modifiés en conséquence.
Comment, selon vous, votre travail évolue-t-il?
Je dirais cependant qu’il est plus important que jamais d’avoir une compréhension approfondie à la fois de la biologie sous-jacente des problèmes que nous étudions et de la rigueur mathématique des outils que nous utilisons. Au fur et à mesure que de plus en plus de données sont générées, je pense que les techniques de calcul ne deviendront que plus importantes, et comprendre quand et quand ne pas les utiliser sera la clé pour conduire de nouvelles découvertes.
Qu’est-ce qui vous plaît le plus dans ce travail?
J’aime apprendre de nouvelles compétences informatiques et les appliquer à des problèmes du monde réel.