Siendo las cosas como son, la decisión normal es reclutar un grupo de investigadores de información para construir su pensamiento, ¿correcto?

Considerando todas las cosas, no en realidad.

Los investigadores de datos, por regla general, se originan en una base inesperada en comparación con los ingenieros de programación. No son realmente increíbles ingenieros de software. De hecho, nunca esperaron serlo. Para un investigador de información, la codificación es simplemente una forma de iluminar el flujo y el reflujo. Además, eso es todo. No son para nada como los diseñadores de programación, no consideran el código como un tipo de artesanía. Obviamente, su astucia no tiene precio, sin embargo, el alcance de las habilidades requeridas para ser un investigador efectivo de la información es a partir de ahora expansivo (particularmente cuando el campo avanza mucho tiempo con las nuevas revelaciones, haciendo que un enorme segmento de datos duramente ganados se desactualicen regularmente). Excesivamente amplio. No se puede anticipar de un individuo que se trabaja excepcionalmente en la visión de PC o en el examen prescriptivo a ser adicionalmente un ingeniero de software de gran alcance, produciendo los modelos y colocándolos en la abrumadora condición de nube adaptable. Al mismo tiempo que se mantiene un código de primera clase y reutilizable. Utilizando una programación útil. O, de nuevo, receptivo. O por otro lado ambas cosas.

Por otra parte, los arquitectos de programación están muy interesados en la IA. Toda la idea es bastante peculiar desde su punto de vista, particularmente cuando la mayoría de los supuestos modelos que su grupo de ciencias de la información hace son cortos, de contenido hacky con llamadas de estrategia anormal y código desarticulado en un nuevo dialecto. ¿Dónde están todos los diseños de estructura? ¿Dónde está el código perfecto? ¿Dónde está el registro u observación? ¿Por qué razón el código no es reutilizable? ¿No debería el código que se ocupa de un tema tan impredecible tener más de 200 líneas de longitud? ¡Es un contenido espantoso que sólo un individuo puede obtener! En cualquier caso, ¿ya no está programado?

La fusión

Con este argumento surgiendo, se concibió una necesidad. Una necesidad de un individuo que se reúna con dos partes en guerra. Uno que estuviera familiarizado sólo lo suficiente en los dos campos para que el artículo fuera completamente operativo. Alguien que tomara el código de los investigadores de información y lo hiciera cada vez más convincente y versátil. Conociendo las diferentes reglas de programación y las grandes prácticas. Absorbiendo incesantemente partes de código que pueden ser utilizadas en el futuro. Uniendo los resultados de asignaciones posiblemente irrelevantes para mejorar la ejecución del modelo considerablemente más. Aclarando las explicaciones de los pensamientos compositivos al grupo de desarrollo. Salvando a los ingenieros de programación de aprender el camino de las ideas más allá de su alcance de primas.

Esa necesidad ha sido satisfecha con un aumento de trabajos de ingeniería de IA.

Lo que está continuamente ausente en cada uno de los artículos, ejercicios de instrucción y libros sobre el ML es la condición de generación. Realmente no existe. La información se apila de los CSV, los modelos se hacen en Jupyter, se dibujan las curvas ROC y voilà – su artículo de IA está listo para la acción. ¡Es hora de otra ronda de subvención de semillas!

En realidad, la mayoría de tu código no está vinculado a la IA. A decir verdad, el código con respecto a ella generalmente toma sólo un par de por ciento de toda tu base de código! Su descubrimiento entrenado ofrece sólo la respuesta menor de JSON – hay un gran número de líneas de código necesarias para seguir esa expectativa. O por otro lado, tal vez todo lo que se obtiene es una tabla de base de datos creada con bits de conocimiento. Una vez más, todo un marco de trabajo debe basarse en ella para que sea útil! Necesitas obtener la información, cambiarla y masajearla, robotizar tus empleos, presentar los pedazos de conocimiento en algún lugar al cliente final. Independientemente de lo poco que sea el tema, la medida del trabajo que hay que hacer en torno a la propia IA es enorme, independientemente de si se inicia la empresa con avances, por ejemplo, la corriente de Apache Wind o el NiFi.

Sin embargo, alguien tiene que atenerse a cada una de las partes de “ciencia de la información” y “programación” juntas. Tomar el modelo preparado y hacer que tome una foto de la condición de generación de calidad. Los horarios agrupan las ocupaciones recalculando las tablas de conocimiento. Servir el modelo progresivamente y filtrar su presentación en la naturaleza. Además, esta es la zona definitiva donde el ingeniero de la IA brilla.

Al hacer la programación, los ingenieros normalmente buscan todos los resultados potenciales en todos los aspectos del uso. Lo que obtienes de un investigador de información es sólo una forma optimista que incita a la creación de modelos para la información específica en el minuto específico en el tiempo. Excepto si se trata de una investigación explícita de una sola vez, el modelo vivirá durante bastante tiempo después de que se produzca. Es más, a medida que el tiempo pasa rápidamente, los errores y todos los casos de borde están apareciendo (muchos de ellos no eran de ninguna manera concebibles cuando el código fue compuesto). De repente, otro valor oscuro aparece en una de las secciones y todo el modelo comienza a funcionar de manera más lamentable.

Como ingeniero de la IA, usted configura sus aplicaciones para tales ocasiones. Das el registro y la observación de las tuberías alrededor de los recados de la IA, así como dentro de ellas. Intentas proteger todos los datos para que sea posible responder a consultas significativas: ¿Cuál es la razón de la presentación del terrible modelo? ¿Desde cuándo ocurre?

Es simplemente una interfaz de programación más

Como no consideras el ML como un encantamiento, conoces todos los demás peligros de la programación normal que pueden surgir cuando se ejecuta un trabajo de IA. La base de datos puede rechazar la asociación. GroupBy puede explotar por un enorme conjunto de datos. La memoria o el círculo pueden estar llenos. Una mezcla de parámetros indicados por el cliente puede ser ilegal para ciertos cálculos. La asistencia externa podría reaccionar con la exención de ruptura en lugar de las acreditaciones. Puede que una sección ya no exista. Aunque nadie entrecierra los ojos cuando tales ocasiones ocurren en una condición de laboratorio protegido regularmente, es su deber garantizar que no ocurrirán cuando el resultado final sea realmente transmitido.

Su grupo de ciencia de la información está en todos los casos cargado de pensamientos. Necesitas asegurarte de que ninguna innovación los restrinja. Por muy grandes y ajustables que parezcan ser las actuales estructuras de ML, en algún momento tus socios tendrán un caso de uso cautivador que no es factible con ninguno de ellos. Considerando todas las cosas, no con las API estándar. Sin embargo, cuando te sumerges en su interior, los cambias un poco y te mezclas con otra biblioteca o dos, lo haces concebible. Haces un mal uso de las estructuras y las utilizas a su máxima capacidad. Eso requiere tanto una amplia programación como información de IA, algo que es muy único para tu trabajo en el grupo.

Además, en cualquier caso, cuando la estructura da todo lo que se necesita para programar con astucia, todavía puede haber problemas con la ausencia de control de los cálculos. Los enormes sistemas neuronales reservan una enorme cantidad de esfuerzo para prepararse. Este valioso tiempo podría verse disminuido por una petición de tamaño en el caso de que se utilizaran sistemas de GPU que funcionaran en máquinas innovadoras. Tú eres el que explora los resultados potenciales, ve las ventajas y desventajas de las diferentes alternativas de nubes y elige la más adecuada.

También puede ser responsable de elegir diferentes dispositivos y entornos, pensando continuamente en todo el ciclo de vida de la empresa (no sólo en la parte de investigación loca) – por ejemplo, Sky blue ML Workbench o IBM Watson pueden ser instrumentos extraordinarios para llevar a cabo la tarea y dirigir la exploración, pero no satisfacen realmente cada una de las necesidades de su última forma del artículo en lo que respecta a la reserva y la observación personalizadas.

Debe mantenerse despierto hasta la fecha con la condición de los avances de la artesanía y buscar continuamente los puntos en los que se podría mejorar la ejecución general del artículo. Ya sea un lenguaje de programación probado en la lucha, una nueva innovación en la nube, una planificación entusiasta o un marco de verificación – al observar tu artículo en el plan maestro y realizarlo bien tanto desde el punto de vista del diseño como de los negocios y la ciencia, eres frecuentemente el principal individuo que tiene la oportunidad de reconocer la zona potencial de progreso.

Esto implica regularmente tomar el código de trabajo y cambiarlo completamente en otra innovación y lenguaje. Afortunadamente, cuando uno “se apodera” de lo que se trata en realidad esta pelusa y de los pasos que se dan constantemente durante el tiempo que se pasa aprendiendo y produciendo los modelos, se entiende que una gran parte de estas API no contrasta en absoluto con la imaginación. En el momento en que se barajan las diferentes estructuras, la mayor parte del procedimiento sigue siendo equivalente. Traes los mejores ensayos de programación y rápidamente empiezas a fabricar una reflexión sobre numerosas empresas aburridas que el grupo de ciencias de la información no mecaniza y el grupo de avance de programación es reacio a echar un vistazo. Una sólida conexión entre dos universos. Un establecimiento fuerte y vigoroso para trabajar en la programación.