Registrare i segmenti principali

Dal momento che la PCA funziona meglio con le informazioni numeriche, si sbarrano i due fattori diretti (contro e am). Vi rimane una rete di 9 sezioni e 32 linee, che andate al lavoro prcomp(), assegnando il vostro rendimento a mtcars.pca. Allo stesso modo, si impostano due contestazioni, la messa a fuoco e la scala, per essere validi. A quel punto potete dare un’occhiata al vostro oggetto PCA con outline().

Si acquisiscono 9 segmenti di testa, che si chiamano PC1-9. Ognuno di questi chiarisce un livello di varietà a tutto campo nel set di dati. In altre parole: PC1 chiarisce il 63% della fluttuazione a tutto campo, il che implica che quasi il 66% dei dati nel dataset (9 fattori) può essere esemplificato semplicemente da una parte di testa. PC2 chiarisce il 23% della variazione. In questo modo, conoscendo la situazione di un esempio in relazione semplicemente a PC1 e PC2, si può ottenere una visione precisa di dove rimane in relazione a diversi esempi, poiché solo PC1 e PC2 possono chiarire l’86% della fluttuazione.

Che ne dite di chiamare str() per visualizzare il vostro oggetto PCA.

Non descriverò qui i risultati in dettaglio, tuttavia il vostro oggetto PCA contiene i dati di accompagnamento:

Il punto medio ($center), la scala (scala $), la deviazione standard (sdev) di ogni parte importante

La relazione (connessione o anticorrelazione, e così via) tra i fattori sottostanti e le parti importanti (rotazione del dollaro)

Le stime di ogni esempio per quanto riguarda i segmenti chiave ($x)

Comprensione del riassorbimento strategico in Pitone

Informatevi su Strategic Relapse, le sue proprietà essenziali, e assemblate un modello AI su un’applicazione certificabile in Python.

Le procedure di arrangiamento sono un elemento fondamentale delle applicazioni di AI e di information mining. Circa il 70% dei problemi in Scienze dell’Informazione sono questioni di raggruppamento. Ci sono un sacco di problemi di organizzazione che sono accessibili, tuttavia, la ricaduta delle coordinazioni è normale ed è un’utile strategia di ricaduta per prendersi cura del problema della doppia caratterizzazione. Un’altra classe di raggruppamento è una Multinomia, che gestisce le questioni in cui sono disponibili diverse classi nella variabile obiettivo. Ad esempio, l’IRIS ha creato un noto caso di disposizione multi-classe. Diversi modelli stanno organizzando la classe articolo / blog / archivio.

Calculated Relapse può essere utilizzato per diversi problemi di caratterizzazione, ad esempio per il rilevamento di spam. Aspettativa di diabete, se un determinato cliente acquisterà un determinato articolo o batterà un altro concorrente, indipendentemente dal fatto che il cliente si collegherà o meno a un determinato avviso, e molti altri modelli sono nel secchio.

Calculated Relapse è uno dei calcoli AI più elementari e generalmente utilizzati per un ordine di due classi. È tutt’altro che difficile da attualizzare e può essere utilizzato come standard per qualsiasi problema di caratterizzazione parallela. Le sue idee di base sono altrettanto utili per un apprendimento profondo. La ricaduta calcolata ritrae e valuta la connessione tra una variabile parallela subordinata e fattori autonomi.

In questo esercizio didattico, familiarizzerete con le cose che vi accompagnano in Calculated Relapse:

Prologo al rilancio strategico

Rilascio diretto rispetto a quello calcolato

Stima della probabilità più estrema rispetto alla consueta tecnica dei quadratini meno quadrati

Come funziona la Riassegnazione Strategica?

Modello al lavoro in Scikit-learn

Valutazione del modello utilizzando la rete delle perplessità.

Punti di interesse e inconvenienti del rilancio strategico

Riabilitazione strategica

La ricaduta strategica è una tecnica misurabile per anticipare due classi. Il risultato o la variabile target è di natura dicotomica. Dicotomica implica che ci sono solo due classi potenziali. Per esempio, può essere utilizzata molto bene per problemi di localizzazione della malignità. Elabora la probabilità di un evento occasionale.

Si tratta di un’istanza non comune di ricaduta diretta in cui la variabile obiettivo è tutta fuori natura. Utilizza un registro dei cambiamenti come variabile dipendente. Calculated Relapse prevede la probabilità che si verifichi un evento in due occasioni utilizzando il lavoro di logit.

Condizione di riattacco dritto:

Dove, y è variabile dipendente e x1, x2 … anche, Xn è un fattore logico.

Capacità Sigmoid:

Applicare la capacità Sigmoid su una ricaduta diritta:

Proprietà di Relapse Strategico:

La variabile bisognosa di ricaduta strategica persegue la Circolazione Bernoulli.

La stima viene fatta con la massima probabilità.

No R Square, il benessere del modello è determinato attraverso Concordance, KS-Insights.

Rilancio diretto contro il rilancio strategico

La ricaduta diretta dà un rendimento incessante, ma la ricaduta calcolata dà un rendimento costante. Un caso di rendimento incessante è il costo della casa e il costo delle scorte. Il caso del rendimento discreto è prevedere se un paziente è maligno o meno, prevedendo se il cliente si agiterà. La ricaduta diritta è valutata utilizzando i quadrati minimi standard (OLS), mentre la ricaduta calcolata è valutata utilizzando l’approccio della stima della massima probabilità (MLE).

La stima di probabilità più estrema contro la tecnica del quadrato meno quadrato

Il MLE è una tecnica di spinta della “probabilità”, mentre l’OLS è una strategia di separazione che limita la possibilità di indovinare. L’amplificazione del lavoro di probabilità decide i parametri che sono sulla buona strada per fornire le informazioni guardate. Da un punto di vista fattuale, il MLE imposta la media e il cambiamento come parametri nel decidere le particolari qualità parametriche per un dato modello. Questa disposizione dei parametri può essere utilizzata per prevedere le informazioni richieste nella diffusione tipica.

Normale I misuratori a meno quadrati vengono elaborati inserendo una linea di ricaduta su determinati focus di informazione che ha la base di tutti gli scostamenti al quadrato (minimo errore al quadrato). Entrambi sono utilizzati per misurare i parametri di un modello di ricaduta rettilineo. MLE accetta una capacità di massa di probabilità congiunta, mentre OLS non richiede alcuna supposizione stocastica per limitare la separazione.

Capacità Sigmoid

La capacità sigmoide, detta anche capacità calcolata, dà una curva a ‘S’ che può prendere qualsiasi numero genuinamente stimato e guidarlo in un incentivo da qualche parte nell’intervallo 0 e 1. Nel caso in cui la curva vada verso l’illimitatezza positiva, y anticipato otterrà 1, e se la curva va verso l’infinità negativa, y anticipato otterrà 0. Nella remota possibilità che il rendimento della capacità di sigmoid sia superiore a 0,5, possiamo disporre il risultato come 1 o Indeed, e nella remota possibilità che sia inferiore a 0,5, possiamo caratterizzarlo come 0 o NO. Il modello outputcannotPer il modello: Se il rendimento è 0,75, possiamo dire che c’è una probabilità del 75 per cento che il paziente subisca gli effetti negativi della crescita maligna.

Un tipo di ricaduta strategica:

Una doppia ricaduta strategica: La variabile obiettivo ha solo due potenziali risultati, per esempio, Spam o Non Spam, Malignità o No Disease.

Multinomio Calculated Relapse: La variabile obiettivo ha almeno tre classificazioni apparenti, per esempio, che anticipano il tipo di vino.

Ordinal Strategic Relapse: la variabile obiettivo ha almeno tre classificazioni ordinali, per esempio, ristorante o articolo che valuta da 1 a 5.