La bioinformatique / ˌbaɪ.oʊˌɪnfərˈmætɪks/(About this soundlisten) est un domaine interdisciplinaire qui crée des techniques et des dispositifs de programmation pour la compréhension des informations naturelles. En tant que domaine scientifique interdisciplinaire, la bioinformatique réunit la science, le génie logiciel, la conception de données, l’arithmétique et les mesures pour décomposer et déchiffrer les informations naturelles. La bioinformatique a été utilisée pour des examens in silico d’enquêtes organiques en utilisant des procédures scientifiques et factuelles.

La bio-informatique intègre des examens organiques qui utilisent la programmation PC comme une caractéristique de leur technique, tout comme une investigation particulière “pipeline” qui est utilisée encore et encore, en particulier dans le domaine de la génomique. Les emplois réguliers de la bio-informatique comprennent la preuve distinctive des qualités des candidats et des polymorphismes de nucléotides uniques (SNP). Souvent, ces preuves distinctives sont apportées dans le but de mieux comprendre les prémisses héréditaires d’une maladie, les ajustements remarquables, les propriétés attractives (en particulier chez les espèces agraires) ou les contrastes entre les populations. De manière moins appropriée, la bioinformatique tente en outre de comprendre les normes hiérarchiques à l’intérieur des successions de nucléides corrosifs et de protéines, appelées protéomique[1].

Présentation

La bioinformatique est devenue un élément important de nombreuses régions scientifiques. Dans la science des essais atomiques, les stratégies bioinformatiques, par exemple, la préparation d’images et de drapeaux permettent d’extraire des résultats utiles à partir de nombreuses informations brutes. Dans le domaine des qualités héréditaires, elle aide au séquençage et à la clarification des génomes et de leurs changements observés. Elle assume un travail d’extraction de contenu de l’écriture naturelle et d’amélioration des ontologies naturelles et de qualité pour trier et interroger les informations organiques. Il s’occupe également de l’examen de la qualité et de l’articulation des protéines et des lignes directrices. Les appareils bio-informatiques aident à contraster, à étudier et à traduire les informations héréditaires et génomiques, et plus encore à comprendre les parties transformatrices de la science atomique. À un niveau de plus en plus intégratif, elle examine et indexe les voies et systèmes organiques qui constituent un élément important de la science des cadres. En science fondamentale, elle aide à la reproduction et à la démonstration de l’ADN, [2] de l’ARN, [2] [3] des protéines [4] tout comme des interactions biomoléculaires [5] [6] [7] [8].

Histoire

On peut vérifier que le terme bioinformatique ne signifiait pas ce qu’il implique aujourd’hui. Paulien Hogeweg et Ben Hesper l’ont écrit en 1970 pour faire allusion à l’étude des formes de données dans les systèmes biotiques[9][10][11] Cette définition définit la bioinformatique comme un domaine parallèle à la chimie naturelle (l’étude des formes de concoction dans les systèmes organiques)[9].

Groupements

Des groupes de matériel héréditaire sont de temps en temps utilisés en bioinformatique et sont plus simples à superviser en utilisant des PC que physiquement.

Les PC sont devenus fondamentaux en science subatomique lorsque les groupements de protéines sont devenus accessibles après que Frederick Sanger ait décidé de l’arrangement de l’insuline au milieu des années 1950. La comparaison de différentes dispositions physiques s’est avérée illogique. Margaret Oakley Dayhoff a été une pionnière dans ce domaine[12]. Elle a accumulé l’une des principales bases de données sur les groupements protéiques, d’abord distribuée sous forme de livres[13] et a été le fer de lance des techniques de succession et d’évolution subatomique[14]. Elvin A. Kabat a également été un des premiers partisans de la bioinformatique, en 1970, avec ses volumes approfondis sur les groupements naturels et les dispositifs d’immunisation mis au point avec le Tai Te Wu entre 1980 et 1991[15].

Objectifs

Pour réfléchir à la façon dont les exercices cellulaires typiques sont ajustés dans les différentes maladies exprimées, les informations organiques doivent être jointes pour encadrer une image complète de ces exercices. Par conséquent, le domaine de la bioinformatique s’est développé à un tel point que la tâche la plus urgente consiste actuellement à examiner et à élucider différents types d’informations. La véritable procédure de dissection et de traduction de l’information est désignée sous le nom de science computationnelle. Les sous-enseignements importants de la bioinformatique et de la science informatique comprennent

Amélioration et exécution de programmes pour PC qui permettent un accès productif à différentes sortes de données, leur utilisation et leur gestion

Progrès des nouveaux calculs (équations scientifiques) et des estimations factuelles qui permettent d’étudier les connexions entre les individus à partir d’énormes indices informationnels. Par exemple, il existe des stratégies pour trouver une qualité à l’intérieur d’un arrangement, pour anticiper la structure des protéines ou leur potentiel de travail, et pour regrouper les groupements de protéines en groupes de successions connexes.

L’objectif essentiel de la bioinformatique est d’élargir la compréhension des formes organiques. Ce qui la sépare des différentes méthodologies, quoi qu’il en soit, c’est l’attention qu’elle porte à la création et à l’application de systèmes concentrés sur le plan informatique pour atteindre cet objectif. Les modèles comprennent la reconnaissance de la conception, l’extraction d’informations, les calculs d’IA et la représentation. Les efforts d’exploration importants dans ce domaine comprennent l’arrangement, la découverte de qualité, la collecte de génomes, la configuration des médicaments, la divulgation de tranquillisants, l’arrangement de la structure des protéines, la prévision de la structure des protéines, l’attente d’une articulation de qualité et de connexions protéine-protéine, l’affiliation à l’échelle du génome, la démonstration de l’avancement et la division/mitose cellulaire.

La bioinformatique implique désormais la création et la progression de bases de données, de calculs, de méthodes informatiques et factuelles, et d’hypothèses pour prendre en charge les questions formelles et terre à terre qui émergent de l’administration et de l’examen des informations naturelles.

Au cours des dernières décennies, les progrès rapides de la recherche génomique et d’autres recherches atomiques ainsi que les avancées dans le domaine des données se sont consolidés pour fournir une énorme quantité de données identifiées avec la science subatomique. La bioinformatique est le nom donné à ces approches scientifiques et d’enregistrement utilisées pour comprendre les procédures organiques.

Des exercices réguliers de bioinformatique permettent de cartographier et de décomposer les successions d’ADN et de protéines, d’ajuster les groupements d’ADN et de protéines pour les examiner, et de créer et d’étudier des modèles 3D des structures protéiques.

Connexion à différents domaines

La bio-informatique est un domaine scientifique qui est comme encore particulier du calcul organique, alors qu’il est fréquemment considéré comme synonyme de science computationnelle. Le calcul naturel utilise la bio-ingénierie et la science pour fabriquer des PC organiques, tandis que la bio-informatique utilise le calcul pour obtenir des données scientifiques. La bio-informatique et la science computationnelle comprennent l’étude des informations organiques, en particulier l’ADN, l’ARN et les groupements de protéines. Le domaine de la bioinformatique a connu un développement dangereux à partir du milieu des années 1990, en grande partie sous l’impulsion de la Tâche sur le génome humain et des progrès rapides de l’innovation en matière de séquençage de l’ADN.

La décomposition de l’information naturelle pour créer des données importantes comprend la composition et l’exécution de programmes de programmation qui utilisent des calculs à partir d’hypothèses de diagrammes, de la conscience artificielle, de l’extraction d’informations d’enregistrement délicat, de la préparation d’images et de la reproduction sur PC. Les calculs s’appuient donc sur des établissements hypothétiques, par exemple, l’arithmétique discrète, l’hypothèse de contrôle, l’hypothèse cadre, l’hypothèse de données et les intuitions.

Séquençage de l’ADN

Article de principe : Séquençage de l’ADN

Avant que les successions puissent être ventilées, elles doivent être obtenues à partir du modèle de banque de stockage d’informations de la Genbank. Le séquençage de l’ADN n’est pas encore une question mineure car les informations brutes peuvent être bruyantes ou tourmentées par le signe d’impuissance. Des calculs ont été effectués pour les bases nécessitant les différentes méthodes d’essai pour traiter le séquençage de l’ADN.

Arrangement se réunir

Article de principe : Collecte des successions

La plupart des procédures de séquençage de l’ADN produisent de courtes parties de groupements qui devraient être rassemblées pour obtenir la qualité totale ou les arrangements du génome. La prétendue méthode de séquençage au fusil (qui a été utilisée, par exemple, par la Fondation pour l’exploration génomique (TIGR) pour la succession du génome de la principale bactérie, Haemophilus influenzae)[19] produit les arrangements d’un grand nombre de petites parties d’ADN (allant de 35 à 900 nucléotides de longueur, en fonction de l’innovation en matière de séquençage). Les parties de l’arrangement couvrent et, lorsqu’elles sont ajustées de manière appropriée par un génome, constituent un programme qui peut être utilisé pour reproduire le génome total. Le séquençage à la carabine permet de regrouper rapidement les informations, mais l’entreprise de collecte des parties peut être très confuse pour des génomes plus grands. Pour un génome aussi énorme que le génome humain, il peut falloir de nombreuses et longues périodes de temps processeur sur d’énormes mémoires, des PC multiprocesseurs pour amasser les parties, et la réunion qui s’ensuit, pour la plupart, contient divers trous qui doivent être comblés plus tard. Shotgun séquençage est la technique pour la décision à toutes fins utiles tous les génomes séquencés aujourd’hui [quand ?], et le génome se réunit les calculs sont un territoire de base de la bioinformatique examiner.

Voir également : enquête sur les regroupements, exploitation des successions, instrument de profilage des arrangements et thème des successions

Explication du génome

Article fondamental : Attente de qualité

En ce qui concerne la génomique, le commentaire est le moyen de désigner les qualités et autres points forts naturels d’un groupe d’ADN. Cette procédure devrait être informatisée compte tenu du fait que la plupart des génomes sont trop énormes pour que l’on puisse même envisager de les annoter à la main, ainsi que de l’envie de commenter autant de génomes que l’on pourrait s’y attendre dans les circonstances, le rythme du séquençage ayant cessé de représenter un goulot d’étranglement. Une explication est possible dans la mesure où les qualités ont un début et un arrêt remarquables, malgré le fait que la succession précise que l’on trouve dans ces domaines peut changer d’une qualité à l’autre.

La principale représentation d’un cadre d’explication du génome de grande envergure a été distribuée en 1995 [19] par le groupe de l’Establishment for Genomic Exploration qui a joué le premier rôle dans le séquençage complet et l’investigation du génome d’un être vivant libre, la bactérie Haemophilus influenzae [19]. Owen White a planifié et assemblé un cadre de produit pour distinguer les qualités codant pour toutes les protéines, les ARN mobiles, les ARN ribosomiques (et les différentes localisations) et pour faire les premières affectations utilitaires. La plupart des cadres actuels d’explication du génome fonctionnent également, mais les projets accessibles pour l’étude de l’ADN génomique, par exemple le programme GeneMark préparé et utilisé pour découvrir les qualités codant les protéines chez Haemophilus influenzae, changent et s’améliorent constamment.

Suite aux objectifs que l’Engagement sur le génome humain a laissé à accomplir après sa conclusion en 2003, une autre entreprise créée par la Fondation nationale d’exploration du génome humain aux États-Unis s’est présentée. Cette prétendue entreprise ENCODE est un assortiment d’informations communautaires sur les composants pratiques du génome humain qui utilise des innovations de pointe en matière de séquençage de l’ADN et des groupes de tuiles génomiques, des avancées prêtes à produire naturellement beaucoup d’informations à un coût par base considérablement réduit, mais avec une exactitude (erreur d’appel de base) et une constance (erreur de rassemblement) similaires.