Il y a deux erreurs qui reviennent toujours lorsque vous apprenez à tester des hypothèses : les faux positifs et les faux négatifs, techniquement mentionnés comme erreur de type I et erreur de type II respectivement.

Au début, je n’étais pas un grand fan de ces concepts, je ne pouvais pas imaginer comment ils pouvaient être le moins utiles. Mais au fil des années, j’ai commencé à changer d’avis. Plus je comprenais et plus je rencontrais ces erreurs, plus elles commençaient à m’exciter et à m’intéresser. En voyant leurs applications et leurs utilisations dans le monde réel, je suis passé d’un étudiant désintéressé à un professeur enthousiaste.

Vous connaissez ces enseignants qui évoquent frénétiquement un sujet que personne ne comprend ou ne veut comprendre ? Oui, c’est moi maintenant ! Et c’est génial, alors j’aimerais vous amener à mon niveau de plaisir avec ce texte en vous montrant comment ces deux erreurs ont des implications pratiques dans plusieurs contextes réels et intéressants. J’espère qu’après l’avoir lu, vous aurez envie d’informer vos proches sur les faux positifs et les faux négatifs. Ils ont de la chance !

Si vous souhaitez comprendre comment procéder, j’ai réalisé une vidéo explicative sur le sujet.

Faire des erreurs, votre ami.

Quelle erreur est la plus grave, selon vous ?

Un faux positif (erreur de type I) – lorsque vous rejetez une véritable hypothèse nulle – ou un faux négatif (erreur de type II) – lorsque vous acceptez une fausse hypothèse nulle ?

J’ai lu à de nombreux endroits que la solution à la présente question est : un faux positif. Je ne crois pas que cela soit vrai à 100%.

La bonne approche scientifique consiste à faire une hypothèse nulle pendant une période où vous essayez de la rejeter, ce qui me donne un résultat positif. Disons donc que je voudrais vérifier si cet article en particulier est plus performant que les autres articles que j’ai même publiés.

En gardant cela à l’esprit, l’hypothèse nulle que je pourrai choisir est la suivante :

“Le nombre de fois que mon article sera lu sera inférieur ou suffisant par rapport à la quantité d’articles comparables que j’ai déjà publiés”.

Si je rejette l’hypothèse nulle, cela suggère une chose parmi d’autres.

1. Ce texte a eu une performance supérieure à la moyenne – Super ! Voilà mon résultat positif.

2. J’ai même fait une erreur de type I. J’ai rejeté une hypothèse nulle qui était vraie. Mon test a montré que j’ai eu une performance supérieure à la moyenne, mais en fait, ce n’est pas le cas. J’ai eu un faux positif.

Oui, ici mon faux positif se traduit par un mauvais résultat, je pourrais inévitablement penser que mon article est meilleur que le sien et à partir de là écrire tous mes articles dans le même style, ce qui finit par nuire au trafic de mon blog. cette petite question peut affecter ma carrière et mon estime de soi de manière négative.

Qu’en est-il du faux négatif ?

Cela se produirait si, par exemple, ce texte était un chef-d’œuvre de la rédaction de blogs mais que mon test démontrait qu’il n’est même pas médiocre. Bien sûr, je ne pourrai pas envisager d’écrire des articles dans ce style de sitôt. Cependant, je suis une personne motivée qui apprend de ses “erreurs”, alors essayez plutôt différentes techniques et créez potentiellement des écrits encore meilleurs.

Ce n’est pas le résultat le plus simple, j’aurai manqué une chance mais ce n’est en aucun cas aussi dévastateur car le faux positif.

Maintenant, c’est souvent un cas où la pire situation est que le faux positif, cependant, un fait important est que j’ai énoncé l’hypothèse nulle pendant une manière spécifique. Si j’avais échangé l’hypothèse nulle et les hypothèses alternatives, les erreurs seraient également échangées.

Laissez-moi vous montrer.

Ma nouvelle hypothèse nulle :

“Le nombre de fois que mon article est lu sera égal au nombre d’articles comparables que j’ai déjà publiés”

Dans une situation faussement positive, je pourrais rejeter une hypothèse nulle qui est vraie. Ainsi, le test montrerait que mon chef-d’œuvre est vraiment médiocre ou pire. Vous vous souvenez de cette phrase ? C’était le faux négatif de l’exemple précédent.

Ce que cela montre, c’est que les deux erreurs sont interchangeables. Par conséquent, il s’agit de planifier votre étude ; vous changerez les choses pour vous aider à éviter le plus gros problème.

Trouver le positif dans le… positif.

Lorsque vous postulez à un emploi dans le secteur des sciences des données, une question d’entretien qui revient toujours est

“Pouvez-vous fournir des exemples de situations où un faux positif donne de meilleurs résultats qu’un faux négatif ?” (et vice versa)

Bien sûr, vous utiliserez l’exemple ci-dessus, mais certains universitaires ne souhaitent pas particulièrement entendre l’idée d’échanger des hypothèses. Je voulais juste prouver dans une certaine mesure que tout n’est pas si noir ou blanc quand il s’agit de cette idée.

De plus, j’ai même beaucoup d’autres exemples pour vous, que vous pouvez simplement poser à votre employeur potentiel et lui montrer que vous vous y connaissez vraiment. Vous les convaincrez en un rien de temps !

Ces exemples comportent des hypothèses qui ne peuvent pas être inversées grâce à la science ou au droit (voir, pas si noir et blanc). Ils nous donnent cependant des situations où le fait d’avoir un faux négatif n’est pas parfait. Bien sûr, nous sommes encore un peu rebelles, mais le faire dans le cadre de la science et du droit, alors, qui peut nous arrêter !

Bébé ou pas bébé ?

Lorsque vous faites un test de grossesse, vous vous posez la question : “Suis-je enceinte ?”

Dans les tests d’hypothèse, par contre, vous avez votre hypothèse nulle :

“Je ne suis pas enceinte”

Rejeter l’hypothèse vous donne un “+” Félicitations ! vous êtes enceinte !

Accepter l’hypothèse vous donne un “-” Désolé, meilleure chance la prochaine fois !

La biologie détermine celle-ci, donc pas d’échange, j’en ai peur. Bien que les tests puissent mal fonctionner et que des faux positifs se produisent, dans ce cas, un faux positif serait un “+” minuscule une fois que vous êtes, en fait, pas enceinte. Un faux négatif, bien sûr, serait le “-” lorsque vous avez un bébé qui grandit en vous.

C’est un exemple honnête, car la situation supérieure est entièrement liée à votre situation !

Imaginez que quelqu’un essaye d’avoir un enfant en bas âge pendant une longue période et que, par miracle, son test biologique soit positif. Il se prépare mentalement à avoir un bébé et, après une brève période d’extase, il détermine d’une certaine manière qu’il n’est en fait pas enceinte !

C’est un résultat terrible !

Un faux négatif pour une personne qui n’a pas vraiment besoin d’un enfant, qui n’est pas prête à en avoir un et qui, lorsqu’elle s’assure d’un résultat négatif, se met à boire et à fumer, est souvent incroyablement dommageable pour elle, sa famille et son bébé.

Mais si vous changez la situation de ces femmes, vous obtenez des résultats qui, bien que non idéaux, sont bien meilleurs .

C’est l’heure des quiz !

Les tests de grossesse ont progressé pour atténuer les probabilités d’un faux négatif. Cela améliore le test car, s’il est peu probable que vous consultiez un médecin pour vérifier un résultat négatif, il peut être judicieux de le faire avec un résultat positif. Il existe diverses raisons médicales pour inciter à un faux positif, mais les faux négatifs n’apparaissent que grâce à une mauvaise exécution du test.

Tests de dépistage du sida

Voici un exemple plus précis.

Imaginez un patient qui passe un test de dépistage du VIH.

L’hypothèse nulle est :

“Le patient n’a pas le virus VIH”.

Les ramifications d’un faux positif seraient initialement déchirantes pour la patiente ; posséder pour affecter le traumatisme de faire face à cette nouvelle et d’en parler à sa famille et à ses amis n’est une situation que l’on souhaiterait pour personne, mais après avoir suivi un traitement, les médecins détermineront qu’elle n’a pas le virus. Encore une fois, cela peut ne pas être une expérience très agréable. Mais ne pas avoir le VIH est en fin de compte une chose honnête.

D’un autre côté, un faux négatif signifierait que la patiente a le VIH mais le test montre un résultat négatif. Les implications de cette situation sont terrifiantes, le patient serait privé de traitements cruciaux et courrait un risque élevé de transmettre le virus à d’autres

Sans aucun doute, le faux négatif ici est que le plus gros problème. Tant pour la personne que pour la société.

Des quizz :

De nombreux médecins qualifient les résultats du SIDA de “réactifs”, au lieu de positifs, en raison des faux positifs. Avant qu’un patient ne soit définitivement déclaré séropositif, une série de tests sont administrés … tout n’est pas soutenu par un seul échantillon de sang.

Positif, jusqu’à ce qu’il soit prouvé négatif

Dans de nombreux pays, la loi stipule qu’un suspect dans le cadre d’une affaire pénale l’est : “Innocent jusqu’à ce que sa culpabilité soit prouvée”.

Cela vient du latin

Ei incumbit probatio, qui dicit, non qui negat ; cum per rerum naturam factum negantis probatio nulla sit”.

Ce qui se traduit par : “La preuve incombe à celui qui affirme, et non à celui qui nie ; car, par le caractère des choses, celui qui nie un fait ne peut produire aucune preuve “*.

L’hypothèse nulle est donc :

“Le suspect est innocent.”

Il suffit donc qu’un faux positif aboutisse à la condamnation d’une partie innocente, tandis qu’un faux négatif produira un verdict d’innocence pour une personne coupable.

Si les preuves sont rares, il est beaucoup plus probable d’accepter l’hypothèse nulle que de la rejeter. Par conséquent, si la loi stipulait que le suspect est “coupable jusqu’à preuve du contraire”, l’hypothèse étant “Le suspect est coupable”, accepter l’hypothèse nulle alors qu’elle est fausse aboutirait à l’emprisonnement de nombreux innocents.

Ainsi, protéger un innocent au risque de laisser (éventuellement) cinq coupables en liberté semble valoir la peine pour plusieurs personnes.

L’idée d’interdire l’accès à un auteur innocent est troublante, car il n’est pas simple de prouver qu’il est réellement innocent une fois qu’il a été condamné. Alors qu’un faux négatif aboutirait à la libération d’un coupable, il pourrait se retrouver avec une affaire réouverte ou, si la personne est un délinquant en série, il sera de toute façon condamné à une date ultérieure.

Quiz :

Jusqu’à récemment, le Mexique utilisait le système du “coupable à moins que son innocence ne soit prouvée”. En conséquence, les juges n’ouvraient même pas la plupart des affaires pénales, car ils pouvaient craindre de mettre trop d’innocents en prison. Depuis 2008, le système de justice pénale mexicain est en transition vers le système “innocent, sauf preuve du contraire”.

Chaque fois que vous respirerez, je vous surveillerai.

Les alcootests sont une nuisance nécessaire. Personne ne veut être arrêté pour un alcootest, d’un autre côté, personne ne veut être tué par un conducteur ivre. Les balançoires et les ronds-points.

L’hypothèse nulle : “Vous êtes en dessous de la limite d’alcoolémie.”

Là encore, il suffit d’un faux positif pour montrer que vous avez dépassé la limite, même si vous n’avez pas touché à une boisson alcoolisée. Un faux négatif indiquerait que vous êtes sobre une fois que vous êtes ivre, ou au moins que vous avez dépassé la limite.

Ces deux problèmes sont dus à différents facteurs qui influencent les échantillons d’alcoolémie. Pour contrer les problèmes de faux positifs (perte de votre permis de conduire, amendes ou peines de prison), la loi stipule que l’on peut fournir un échantillon de sang ou d’urine pour prouver son innocence (si on est, c’est-à-dire).

Dans cette optique, un faux négatif est clairement le problème le plus important. Permettre à des conducteurs ivres de continuer à conduire en supposant qu’ils sont sobres est clairement dangereux pour eux et leur entourage. Perdre quelques heures de votre journée peut être un petit prix à payer si cela permet de garder plus de personnes au-dessus de la limite, hors de la route.

Quiz :

Les niveaux d’alcool courants auxquels les individus sont considérés comme étant légalement affaiblis pour le golf vont de 0,00% à 0,08%. Les principaux critères de référence communs dans le monde sont 0,00%, également appelé intolérance, et 0,05%. La limite est la plus élevée dans les îles Caïmans, soit 0,1 %. Cela n’implique pas une meilleure tolérance à l’égard de la conduite en état d’ivresse, donc avant de prendre la route après une bouteille de Jack Daniels, il faut se rappeler que la police locale fait vraiment respecter les lois par des contrôles fréquents.

La camelote des uns est le trésor des autres.

La dernière chose dont j’aimerais parler, ce sont les courriers électroniques non sollicités (SPAM).

De nombreux sites web vous diront quelque chose du genre : “S’il vous plaît, vérifiez votre dossier SPAM. L’e-mail que nous venons de vous envoyer, vous vous y trouverez.”

Les fournisseurs de courrier électronique utilisent de plus en plus des algorithmes de traitement des données pour filtrer le SPAM de ce qui est recherché. c’est souvent un sujet qui mérite d’être écrit. Cependant, nous parlons de choses et d’autres lorsque les e-mails sont égarés.

J’ai été stupéfait lorsque, il y a quelques semaines, j’ai envoyé un courriel à ma sœur et que son fournisseur de messagerie l’a marqué comme étant un SPAM ! Comment osent-ils ! La seule explication que j’ai pu trouver est que j’ai utilisé ma boîte aux lettres personnelle pour envoyer des courriels à l’adresse électronique de l’entreprise de ma sœur. L’algorithme n’a donc pas trouvé de preuve que mon courrier électronique serait souhaité par ma sœur (peut-être sait-elle quelque chose que je ne sais pas…). Il a donc accepté l’hypothèse nulle :

“Cet e-mail est un SPAM.”

Si l’algorithme rejette l’hypothèse nulle, l’e-mail passe. Un faux positif signifierait que votre boîte de réception contient des e-mails étranges de princes nigérians qui cherchent à vous épouser, ou de parents perdus depuis longtemps qui posent pour vos coordonnées bancaires, afin de pouvoir vous envoyer l’héritage massif du chat de la belle-fille du cousin de votre arrière-grand-mère.

Un faux négatif pourrait bien être le problème le plus important. Vous passerez à côté d’un appel à participation pour une interview ou des photos de vacances de votre frère ou de votre sœur, simplement parce qu’ils sont perdus dans les quantités abondantes de SPAM – que vous passez simplement en revue sans enthousiasme avant de les supprimer.

Cela est dû à des préférences personnelles, mais certaines personnes sont tellement furieuses de recevoir une notification sur leur téléphone, pour ensuite découvrir un courriel inutile, que quelques courriels personnels mal placés sont un peu trop chers.

Quiz :

Plus de 95 % des demandes d’amis que vous transmettez à Facebook sont acceptées, car vous touchez toujours des personnes tordues que vous reconnaissez. Cela n’est souvent pas vrai pour les comptes de spam et c’est l’une des façons dont Facebook les détecte. Cependant, les robots ont récemment adopté une technique où ils prétendent être des femmes attirantes et se spécialisent dans les utilisateurs masculins comme leurs victimes. Comme les utilisateurs masculins acceptent en moyenne ces invitations d’amis, il faut beaucoup plus de temps pour détecter les robots.

Il s’agit là de quelques échantillons courants d’une fois que vous pouvez avoir des faux positifs et des faux négatifs. Comme vous le verrez, l’erreur préférable dépend vraiment des choses elles-mêmes, de votre préférence personnelle ou de la façon dont l’étude a été conçue (et que vous pouvez simplement changer d’hypothèse si nécessaire). J’espère donc que vous ne suivrez pas l’hypothèse générale selon laquelle les faux positifs entraînent des problèmes plus importants et que vous serez mieux à même de fournir des exemples solides pour l’étayer.