Informations

Programmation de base et bioinformatique


En tant qu'étudiant diplômé en biologie moléculaire, j'ai décidé d'apprendre quelques bases en programmation et en bioinformatique, car tout le monde dit que c'est crucial. Par exemple, qu'apprendriez-vous si vous deviez travailler avec des données RNA-Seq, les comparer et les interpréter ?

Merci!


En effet, la question est vaste et assez difficile à répondre je pense. Je vais essayer. Je suis très heureux d'éditer pour améliorer cette réponse.

Le domaine de la bioinformatique est un vaste domaine. Les bioinformaticiens ont besoin de connaissances de base en

  • la biologie
  • génétique moléculaire
  • Génétique des populations
  • la programmation
  • statistiques

Vous pouvez trouver des cours sur les statistiques appliquées à la bioinformatique ici (langage R) et ici (je n'ai pas regardé ces sources).

Comment commencer à programmer ? -Python

Vous semblez être principalement intéressé par la programmation. je pense que Python est un très bon début pour entrer en contact avec la programmation. La programmation peut paraître un peu effrayante quand on ne sait pas vraiment de quoi il s'agit mais on peut facilement, en quelques jours, acquérir des connaissances de base dans ce domaine et déjà résoudre des problèmes assez soignés. Beaucoup de gens ont beaucoup de plaisir à apprendre à programmer. Et vous serez probablement étonné par toute la puissance que cet outil vous offrira. Personnellement, j'ai beaucoup aimé apprendre à programmer en Python. Je l'ai fait (j'étais surtout intéressé par la programmation orientée objet, vous apprendrez ce que cela signifie) en un jour ou deux avec une très bonne source mais malheureusement, cette source n'est pas disponible en anglais. Mais il existe des tonnes de documents d'introduction, vous n'aurez aucune difficulté à en trouver un bon. Je vous conseillerais de télécharger directement Python et de regarder les cours en ligne sur khan academy ou EdX (je ne les ai pas regardés).

Analyse de données - R

Bien que Python soit très populaire, je pense qu'en tant que biologiste, il est très important que vous connaissiez R. R est un langage de programmation lent (comparé à Python, C, Java,…) mais il est très utile pour l'analyse statistique et l'affichage visuel des données. En outre, de nombreuses personnes utilisent R en bioinformatique (généralement pour l'analyse phylogénétique). Je pense qu'acquérir des connaissances de base en R prend plus de temps qu'en Python car nous avons tendance à utiliser R en raison de son énorme quantité de fonctions déjà existantes et donc, nous devons apprendre beaucoup de ces fonctions avant de comprendre que R peut en effet être beaucoup plus utile que Python pour certaines tâches.

Ligne de commande - Script Shell

Script shell (BASH par exemple) est un langage très spécifique et très important aussi. Très utile pour manipuler, transférer des fichiers, gérer des processus ou à peu près tout ce qui se passe sur votre ordinateur.

Autre

C et C++ sont très rapides et très utilisés aussi. Perl est couramment utilisé pour l'analyse de séquences génomiques (bien que Perl perde lentement des utilisateurs au profit de Python).

Utilité de la programmation

Vous posez également des questions sur l'utilité de la programmation. Eh bien, il est utilisé dans à peu près tous les domaines de la biologie. Il est utilisé pour analyser des données empiriques, des simulations informatiques en génétique des populations, la théorie des graphes, l'annotation de séquences d'ADN,… Je suppose que 98% des biologistes ont au moins quelques connaissances de base en programmation. Le point principal de la programmation est qu'elle effectue des calculs beaucoup plus rapidement que tout ce que vous pourriez jamais réaliser avec votre calculatrice. Typiquement, en bioinformatique, l'analyse des séquences d'ADN demande souvent un calcul très intense et demande une grande puissance de calcul. Des processus tels que la construction d'arbres phylogénétiques, la détermination de l'adéquation des modèles évolutifs, l'annotation de l'ADN, l'alignement des séquences d'ADN, l'analyse des puces à ADN et bien d'autres choses sont toutes sortes de tâches qui nécessitent une programmation.


Voir la vidéo: Cours Bioinformatique-Chapitre 5: Alignement-3ème année-20192020 (Janvier 2022).