Les dialectes de programmation Python et R sont régulièrement creusés l’un contre l’autre pour déterminer lequel est le meilleur pour la science de l’information et l’investigation. Ces deux dialectes sont très répandus, bien que Python ait toutes les caractéristiques pour être utilisé de manière beaucoup plus large, en tout cas par des personnes qui savent comment programmer.
Pourtant, la science de l’information est un domaine particulier. Ainsi, alors que Python se développe comme le langage le plus célèbre de la planète, R a toujours sa place et présente des points d’intérêt pour ceux qui font de la recherche d’information.
Pour mettre un terme au badinage durable entre R et Python, le professeur de génie logiciel Norm Matloff du College of California, à Davis, a distribué un bref résumé de leurs qualités relatives en les croisant sur des mesures clés, notamment le polissage, les domaines dans lesquels ils sont utilisés, les systèmes biologiques des bibliothèques et la difficulté à apprendre.
Matloff a composé quatre livres sur R et est le responsable éditorial du Journal de R, on peut donc penser qu’il le soutient plutôt que Python. Quoi qu’il en soit, il dit croire que son enquête est considérée comme “raisonnable et favorable”.
Il dit que c’est une “victoire incontestable pour Python” en ce qui concerne le polissage, dans une certaine mesure en raison de l’utilisation restreinte de Python des supports et des parenthèses. “Python est lisse”, inclut-il.
Quoi qu’il en soit, c’est une “immense victoire pour R” pour les nouveaux venus qui adaptent les deux dialectes. Son argument contre Python est qu’un individu qui l’utilise pour la science de l’information doit découvrir d’autres paquets Python, comme NumPy, qui apporte à Python des forces de recherche d’informations semblables à celles de Matlab. R, qui travaille pour l’enregistrement mesurable, a une recherche d’informations qui comprend effectivement des informations implicites.
“D’autre part, les types de treillis et les conceptions fondamentales sont travaillés en base R. L’amateur peut faire des recherches d’informations simples en quelques minutes”, se bat Matloff.
“Les bibliothèques Python peuvent être douteuses à concevoir, dans tous les cas, pour les frameworks sharp, alors que la plupart des bundles R forcent le droit de quitter le conteneur”.
Le fichier Python Bundle File (PyPI) compte à ce jour plus de 183 000 entreprises, ce qui éclipse énormément les paquets R accessibles sur le Thorough R Chronicle System (CRAN). Comme indiqué par le CRAN, il y a 14 385 paquets accessibles. En dépit de cette distinction, Matloff considère qu’il y a égalité.
VOIR : Python mange le monde : comment l’entreprise d’un ingénieur est devenue le langage de programmation le plus grésillant au monde (PDF) (TechRepublic)
PyPI, note-t-il, “semble être mince en matière de science de l’information”. Les recherches sur PyPI “n’ont rien donné” pour le modèle logarithmique, la rechute de Poisson, les facteurs instrumentaux, l’information spatiale et le taux d’erreurs familiales.
Quoi qu’il en soit, Python a un “léger avantage” sur R en IA, et Matloff est de l’avis général en faveur de l’amélioration des bibliothèques d’IA pour R, ce qui, selon lui, devrait être possible sans trop de difficultés.
“La capacité des bibliothèques Python provient de la mise en place de certaines opérations de lissage d’image, qui pourraient effectivement être actualisées dans l’enveloppe Keras de R, et en ce qui concerne cela, une variante R non altérée de TensorFlow pourrait être créée”, soutient M. Matloff.
VOIR : Comment créer une profession de designer efficace (PDF gratuit)
Il s’attaque ensuite à des génies de l’IA Python (ML) qui “comprennent souvent mal, et parfois même méprisent, les questions factuelles de ML”. De cette façon, sur le sujet de savoir quel langage a la meilleure justesse factuelle, c’est une “victoire majeure pour R”.
Un “malheur désagréable pour R” est sa solidarité linguistique. R, dit-il, “se décompose en deux lingos communément incompréhensibles, le R conventionnel et le Tidyverse”. De plus, il accuse sans équivoque cette circonstance pour l’organisation RStudio.
Tidyverse est un assortiment de célèbres ballots R. Pour l’essentiel, Matloff accepte qu’une entreprise comme RStudio n’ait pas “l’impact excessif” qu’elle a sur l’entreprise R.
“Il serait peut-être progressivement digne si le Tidyverse était meilleur que le R conventionnel, mais comme j’aimerais le croire, ce n’est pas le cas. Cela rend les choses de plus en plus difficiles pour les apprentis. Par exemple, le Tidyverse a un tel nombre de capacités, dont certaines sont ahurissantes, qu’il faut trouver comment faire des activités exceptionnellement simples en base R”, affirme M. Matlof.