El algoritmo maestro

0 Shares
0
0
0

Comprende cómo los algoritmos están cambiando el mundo.

 

Uno de los mayores misterios del mundo es cómo una libra de gelatina gris en la cabeza de un recién nacido puede producir una corriente de conciencia, capaz de percibir el mundo e interactuar con él. Tal vez sea más sorprendente lo poco que requiere la enseñanza del cerebro mientras está experimentando esta transformación.

 

Ninguna máquina en la historia de la humanidad tiene una capacidad de aprendizaje comparable al cerebro humano. Pero las cosas están cambiando. Nuestra capacidad para crear máquinas cada vez más sofisticadas significa que, en el futuro, podrán desafiar al cerebro.

 

Las máquinas pueden incluso superar la capacidad humana. Pueden aprender de las enormes cantidades de datos que encontramos e ignoramos todos los días. Así que pongamos nuestros límites de pensamiento y exploremos el fascinante mundo de los algoritmos y el aprendizaje automático.

 

En este resumen, descubrirá

 

  • cómo las máquinas podrán aprender sin instrucción en el futuro;
  •  

  • por qué ver patrones a veces es un problema; y
  •  

  • cómo un algoritmo para ganar Tetris podría mejorar su ruta al trabajo.
  •  

El aprendizaje automático puede resolver problemas importantes al observar los datos y luego encontrar un algoritmo para explicarlos.

 

¿Alguna vez te has sentido frustrado con recetas con instrucciones imprecisas, como “cocina a fuego medio durante 15-20 minutos”? Si es así, podría ser alguien que prefiere un buen algoritmo.

 

A diferencia de las recetas, los algoritmos son secuencias de instrucciones precisas que producen el mismo resultado cada vez.

 

Aunque es posible que no se dé cuenta de su presencia, los algoritmos se utilizan en todas partes. Ellos programan vuelos, enrutan los paquetes que envía y se aseguran de que las fábricas funcionen sin problemas.

 

Estos algoritmos estándar están diseñados para aceptar información como entrada, luego realizar una tarea y producir una salida.

 

Digamos que la tarea de un algoritmo es dar instrucciones. Cuando ingresa dos puntos, la salida sería la ruta más corta entre estos dos puntos.

 

Pero los algoritmos de aprendizaje automático, o ML, son un paso más abstractos: ¡son algoritmos que generan otros algoritmos! Dados muchos ejemplos de pares de entrada-salida para aprender, encuentran un algoritmo que parece convertir las entradas en salidas.

 

Esto es útil para encontrar algoritmos para tareas que los programadores humanos no pueden describir con precisión, como leer la escritura de alguien. Al igual que andar en bicicleta, descifrar la escritura a mano es algo que hacemos inconscientemente. Tendríamos problemas para poner nuestro proceso en palabras, y mucho menos en un algoritmo.

 

Gracias al aprendizaje automático, no tenemos que hacerlo. Simplemente le damos al algoritmo de aprendizaje automático muchos ejemplos de texto escrito a mano como entrada, y el significado del texto como la salida deseada. El resultado será un algoritmo que puede transformar uno en el otro.

 

Una vez aprendido, podemos usar ese algoritmo siempre que queramos descifrar automáticamente la escritura a mano. Y, de hecho, así es como la oficina de correos puede leer el código postal que escribe en sus paquetes.

 

Lo bueno es que los algoritmos de ML como este se pueden usar para muchas tareas diferentes, y la resolución de problemas emergentes es solo una cuestión de recopilar suficientes datos.

 

Esto significa que el algoritmo subyacente inicial suele ser el mismo y no requiere ajustes para resolver problemas aparentemente no relacionados.

 

Por ejemplo, podrías pensar que hacer un diagnóstico médico, filtrar el correo no deseado de tu correo electrónico y descubrir el mejor movimiento de ajedrez podría necesitar algoritmos completamente diferentes. Pero, en realidad, con un algoritmo ML y el tipo correcto de datos, puede resolver todos estos problemas.

 

Para evitar patrones alucinantes, los algoritmos de aprendizaje deben restringirse y probarse para su validez.

 

Alucinar es ver algo que realmente no existe. Curiosamente, las alucinaciones son un problema central en el mundo de los algoritmos. En 1998, un libro superventas, The Bible Code , afirmó que la Biblia contenía predicciones ocultas que se revelaban al omitir selectivamente ciertas líneas y letras.

 

Los críticos refutaron esta afirmación, sin embargo, al demostrar que se pueden encontrar “patrones” similares en Moby Dick y dentro de los fallos de la Corte Suprema.

 

Este es un buen ejemplo de patrones alucinantes, que, en la jerga de ML, es el resultado del sobreajuste . El sobreajuste ocurre cuando un algoritmo es tan poderoso que puede “aprender” cualquier cosa. Verá, cuando arroja suficiente potencia informática a un conjunto de datos como la Biblia, siempre encontrará patrones porque la computadora puede construir modelos cada vez más complejos hasta que surjan algunos. Pero el modelo resultante no funcionará en ningún otro dato.

 

Entonces, para tener sus algoritmos bajo control, su potencia debe estar limitada limitando su complejidad.

 

Con el tipo correcto de restricciones limitantes, se asegura de que el alcance de su algoritmo no sea demasiado grande y se asegura de que los resultados sean verificables y consistentes. Si es demasiado flexible, su algoritmo puede terminar como The Bible Code, encontrando patrones en cualquier texto o conjunto de datos.

 

Pero, ¿qué sucede si su algoritmo descubre múltiples patrones que explican los datos que tiene pero no está de acuerdo con los nuevos datos? ¿Qué resultado deberías creer? ¿Y cómo puede estar 100 por ciento seguro de que sus resultados no son solo una casualidad?

 

Esto es cuando entran los datos holdout .

 

Cuando prepara su conjunto de datos original para el algoritmo de aprendizaje, es importante dividirlo en un conjunto de entrenamiento , que el algoritmo utiliza para aprender, y un conjunto de reserva , contra el cual probarlo.

 

De esta manera puede verificar los resultados y confirmar que los patrones encontrados en los datos son válidos.

 

Asegurar la validez de los resultados es de lo que se trata el trabajo de un experto en ML. Su trabajo es restringir el poder del algoritmo asegurándose de que las reglas no sean demasiado flexibles y que los resultados funcionen bien tanto con los datos del conjunto de entrenamiento como con los datos del conjunto de espera.

 

Las reglas que usan el razonamiento deductivo y los árboles de decisión pueden permitir que las máquinas y los algoritmos piensen lógicamente.

 

Así como el mundo médico tiene especialistas que han preferido formas de tratar el cuerpo, el mundo del aprendizaje automático tiene ramas especializadas con sus propias perspectivas y estilo de algoritmos preferido.

 

Los simbolistas , por ejemplo, manipulan símbolos y aprenden reglas para crear inteligencia artificial (IA).

 

Los simbolistas son la rama más antigua de la comunidad de IA; son racionalistas que ven los sentidos como poco confiables y, por lo tanto, creen que toda la inteligencia debe aprenderse a través de métodos lógicos.

 

Por esta razón, el algoritmo preferido de los simbolistas es deducción inversa.

 

En términos generales, la deducción inversa crea reglas al vincular declaraciones separadas, como esta: si proporciona dos declaraciones, como “Napoleón es humano” y “Por lo tanto, Napoleón es mortal”, el algoritmo puede llegar a declaraciones más amplias, como ” Los humanos son mortales “.

 

Si bien este tipo de algoritmo es bueno para la minería de datos y la clasificación de cantidades relativamente grandes de datos, como registros médicos, es costoso e ineficiente para bases de datos realmente masivas porque tiene que considerar todas las relaciones posibles entre todas las variables en los datos , lo que resulta en una complejidad exponencialmente creciente.

 

Entonces, para que este trabajo sea menos complejo, puede usar árboles de decisión para encontrar estas reglas.

 

Como su nombre lo indica, los árboles de decisión ramifican los datos en conjuntos más pequeños. Lo hacen básicamente jugando un juego de 20 preguntas, y cada pregunta o regla reduce aún más las opciones y posibilidades.

 

Por ejemplo, si desea elaborar reglas para examinar los registros médicos, puede utilizar un árbol de decisión. Comenzaría con todos los registros, pero luego, en los diversos puntos de ramificación en el árbol, los dividiría en grupos como “saludable”, “leucemia”, “cáncer de pulmón”, etc. El algoritmo de ML luego encontraría reglas adecuadas que también darían como resultado esta división.

 

Este método evita el sobreajuste al restringir el número de preguntas que hace el árbol de decisiones, de modo que solo se aplican las reglas generales y más ampliamente aplicables.

 

Los árboles de decisión se usan en software que realiza diagnósticos médicos al reducir los síntomas de alguien. También se utilizaron en una aplicación que podía predecir el resultado de los fallos de la Corte Suprema con una tasa de precisión del 75 por ciento; Las predicciones de un panel de expertos humanos tenían una tasa de precisión de menos del 60 por ciento.

 

En el próximo capítulo, veremos cómo lidiar con datos de un tipo más difícil y más humano, datos que son inciertos o incluso contradictorios.

 

Puede evitar que los algoritmos efectivos se sobreajusten manteniendo los modelos abiertos y restringiendo los supuestos.

 

Bayesianismo es otra rama popular del aprendizaje automático, y sus seguidores son prácticamente religiosos en su devoción.

 

Al contrario de los racionalistas, los bayesianos son empiristas que creen que el razonamiento lógico es defectuoso y que la verdadera inteligencia proviene de la observación y la experimentación.

 

Su algoritmo de elección se llama Bayesiano inferencia , que funciona manteniendo abiertas varias hipótesis o modelos diferentes simultáneamente. El grado en que creemos en cualquiera de estas hipótesis o modelos variará dependiendo de la evidencia encontrada en los datos, ya que algunos recibirán invariablemente más apoyo que otros.

 

Este enfoque también puede ayudar a proporcionar un diagnóstico médico. Mientras permanece abierto a muchas enfermedades hipotéticas y sus síntomas, el algoritmo puede filtrar los datos del registro de un paciente para hacer la mejor combinación. Cuantos más datos proporcione el registro, más enfermedades puede descartar el algoritmo, hasta que una hipótesis se convierta en el ganador estadístico.

 

La inferencia bayesiana es un algoritmo poderoso, y evita el sobreajuste al restringir las suposiciones sobre causas y eventos.

 

Por ejemplo, si es evidente que tiene gripe pero queremos saber si también tiene fiebre o tos, podemos clasificar la gripe como causa y la fiebre o tos como eventos. La suposición restrictiva aquí es asumir que los dos eventos no se influyen entre sí, lo que significa que la tos no afecta sus posibilidades de tener fiebre.

 

Al ignorar las posibles conexiones entre eventos, la inferencia bayesiana evita el sobreajuste y se vuelve demasiado poderoso al centrarse estrictamente en la conexión entre causa y efecto.

 

Suposiciones similares son utilizadas por el software de reconocimiento de voz como Siri. Cuando dices: “¡Llama a la policía!”, La inferencia bayesiana mantiene abiertas las opciones y considera la probabilidad de que hayas dicho: “¡Llama al por favor!”

 

Pero al revisar su base de datos de frases populares, es suficiente observar la frecuencia con la que ciertas palabras se suceden. Y, en este caso, está claro que “policía” sigue la palabra “el” con mucha más frecuencia que “por favor”

 

Los algoritmos de aprendizaje sin supervisión son excelentes para encontrar la estructura y el significado en los datos sin procesar.

 

¿Alguna vez has notado cómo puedes escuchar cuando alguien dice tu nombre, incluso si se dice en voz baja y estás rodeado de docenas de personas que hablan en voz alta? Tenemos una capacidad impresionante para filtrar la información que nuestros oídos captan y se centran. ¿Podría un algoritmo aprender a hacer lo mismo?

 

De hecho, aprendizaje no supervisado es una categoría de algoritmos que están diseñados para utilizar datos sin procesar y ruidosos.

 

Todos los algoritmos de los capítulos anteriores han utilizado datos que contienen ejemplos etiquetados para aprender, como ejemplos de diagnósticos correctos o correos electrónicos que han sido etiquetados como spam o no spam.

 

Sin embargo, los algoritmos de agrupamiento son ​​un grupo de estudiantes sin supervisión que pueden descubrir categorías a partir de grandes cantidades de datos sin procesar.

 

Este es el tipo de algoritmo que se puede usar en el software de reconocimiento de imagen o aislamiento de voz, que puede identificar una cara u objeto entre millones de píxeles, o destacar una voz en una multitud ruidosa.

 

Estos algoritmos pueden encontrar estructuras significativas como estas al reducir la dimensionalidad de los datos llevando la descripción de lo que está buscando a sus elementos esenciales principales.

 

Los artistas de bocetos, por ejemplo, pueden reproducir caras con tanta precisión porque memorizan diez variaciones diferentes de cada rasgo facial: nariz, ojos, oídos, etc. Esto reduce considerablemente sus opciones, lo que hace posible producir un dibujo aceptable basado solo en una descripción. Del mismo modo, los algoritmos de reconocimiento facial, después de preprocesar todas las diferentes opciones, solo necesitan comparar unos cientos de variables en lugar de un millón de píxeles.

 

Las redes neuronales son ​​otra forma efectiva de procesar cantidades masivas de datos sin procesar.

 

Mientras otros algoritmos procesan datos secuencialmente, las redes neuronales funcionan como un cerebro y procesan múltiples entradas al mismo tiempo.

 

Una de las redes neuronales más grandes jamás creada pasó tres días revisando diez millones de videos de YouTube seleccionados al azar. Y sin que se les dijera qué buscar, el programa aprendió a reconocer rostros humanos y, tal vez como era de esperar, gatos.

 

Ahora que conoce todos estos algoritmos diferentes, seguramente ha comenzado a preguntarse qué sucedería si se combinaran en un algoritmo maestro. Bueno, vamos a averiguarlo.

 

No existe un algoritmo perfecto, y se requiere un algoritmo maestro unificador para abordar los grandes problemas.

 

Entonces, con todos estos algoritmos diferentes, quizás te preguntes, ¿cuál es el mejor?

 

La verdad es que no existe un algoritmo perfecto; todos se basan en diferentes supuestos fundamentales.

 

Sorprendentemente, para cada conjunto de datos donde un algoritmo presenta algo útil, un defensor del diablo podría usar el mismo algoritmo en otro conjunto de datos para mostrar que todo lo que hace no tiene sentido. Por eso es importante hacer las suposiciones correctas sobre los datos a los que está aplicando el algoritmo.

 

Afortunadamente, este no es un problema tan grande como podría parecer.

 

La mayoría de los problemas más difíciles en informática están fundamentalmente relacionados y podrían resolverse con un buen algoritmo.

 

Solo considere algunos problemas que ya se han resuelto: determinar la ruta más corta para visitar varias ciudades, comprimir datos, controlar el flujo del tráfico urbano, convertir imágenes 2D en formas 3D, diseñar componentes en un microchip y, por último, pero no menos importante, jugando al tetris.

 

Descubrir una solución eficiente para uno de estos problemas esencialmente los resolvió a todos.

 

Puede ser difícil creer que un algoritmo puede abordar tanto, pero es cierto y se considera una de las ideas más fascinantes de toda la informática.

 

Desafortunadamente, los problemas más importantes que enfrenta la humanidad requieren algoritmos mucho más capaces que los disponibles actualmente.

 

Por ejemplo, para encontrar una cura para el cáncer, el algoritmo definitivo debe incorporar todo el conocimiento adquirido previamente, además de poder mantenerse al día con la velocidad a la que se publican nuevos descubrimientos científicos. Además de eso, necesitaría considerar la relevancia de todos estos datos y discernir una estructura general que nadie ha podido ver todavía.

 

Si bien esto actualmente está más allá de la capacidad de los algoritmos, se está progresando.

 

Tome a Adam, por ejemplo, un robot de investigación en el Instituto de Biología de Manchester que ha aprendido conocimientos generales sobre genética y puede sugerir hipótesis. ¡Incluso puede diseñar y llevar a cabo experimentos, así como probar y analizar sus resultados!

 

En los negocios modernos, encontrar el mejor algoritmo y los mejores datos es la clave del éxito.

 

“Los datos son el nuevo petróleo”, o al menos así lo dicen los profetas empresariales modernos.

 

También es difícil argumentar en contra, porque, en el mundo de las grandes empresas, muchos sienten que la compañía con los mejores algoritmos es la compañía que va a ganar.

 

En la era previa a Internet, si una empresa tenía problemas para conectarse con los consumidores, podría resolverlos con una solución física, como idear una mejor campaña publicitaria.

 

Pero con Internet, la elección del consumidor era prácticamente ilimitada, y ahora la pregunta es: ¿cómo decide qué comprar cuando hay 10 millones de opciones?

 

Aquí es donde entra el aprendizaje automático y ayuda a reducir las cosas.

 

Amazon ha liderado la carrera ofreciendo sugerencias inteligentes sobre qué productos pueden gustar a los clientes, y su servicio cubre casi todos los mercados.

 

Pero la carrera todavía está en marcha. Y quien tenga los mejores datos puede encontrar el mejor algoritmo, por lo que los datos son un gran activo estratégico. El valor promedio del rastro de datos de un usuario para la industria de la publicidad en línea es de alrededor de $ 1,200 por año. Los datos de Google sobre usted cuestan alrededor de $ 20, mientras que los de Facebook cuestan $ 5.

 

El negocio de comprar datos se ha vuelto tan grande que los expertos creen que las uniones de datos y bancos de datos eventualmente permitirán a los ciudadanos y las empresas privadas llevar a cabo negociaciones justas sobre el uso de sus datos.

 

Databanks podría mantener su información segura y también permitirle establecer los términos para cuándo y cómo se accede a ella. Y una unión de datos podría funcionar como otros sindicatos de trabajadores, con personas de ideas afines uniendo fuerzas para garantizar que la información se use de manera justa y precisa.

 

Este tipo de regulación podría beneficiar a todos. Podría ayudar a las empresas al mejorar sus algoritmos; podrías obtener mejores recomendaciones de compra; y, con la seguridad adicional, más personas podrían sentirse cómodas compartiendo sus datos para ayudar a avanzar en causas médicas y humanitarias.

 

En el futuro, tendrás un modelo digital de ti mismo para ayudarte a hacer la vida más fácil.

 

Lo más probable es que te hayan pillado hablando contigo mismo en un momento u otro. Bueno, si alguna vez has deseado poder hablar contigo mismo, tus sueños pronto se harán realidad.

 

Al compartir todos tus datos con el último algoritmo de aprendizaje maestro, terminarás con un modelo digital bastante preciso de ti mismo.

 

Imagine el algoritmo maestro: sembrado con una base de datos que contiene todo el conocimiento humano general, luego personalizado con todos los datos que ha recopilado a lo largo de su vida, incluidos correos electrónicos, registros telefónicos, búsquedas en la web, compras, descargas, salud registros, direcciones de GPS, etc., etc.

 

Luego puedes descargar la versión digital del modelo aprendido de ti mismo en una unidad flash, llevarla contigo en tu bolsillo y usarla como un mayordomo personal para ayudarte a manejar tu vida.

 

Con su propio digital usted, se podrían tratar rápidamente las pequeñas molestias, ahorrándole tiempo y molestias.

 

Además de cosas simples como búsquedas web automatizadas y recomendar nuevos libros y películas, también podría presentar sus declaraciones de impuestos, pagar sus facturas de tarjetas de crédito, ordenar su correo electrónico, planificar sus vacaciones y, si es soltero, incluso podría establecerte fechas.

 

O, si te sientes introspectivo, puedes configurarlo en un modo de conversación y conversar con tu modelo digital.

 

En una sociedad donde los modelos digitales son algo común, incluso podría interactuar con el resto del mundo en su nombre.

 

Imagina que estás buscando un nuevo trabajo. Después de pasar un segundo en LinkedIn, su modelo podría solicitar todos los trabajos adecuados disponibles, incluidos algunos trabajos perfectos que de otro modo podría haber pasado por alto.

 

Esas compañías también pueden tener modelos personales, y su yo digital podría interactuar con ellos y proporcionarle una lista de todas las compañías que aceptaron una entrevista personal. Todo lo que tiene que hacer es confirmar su cita.

 

Tu yo digital será como la dirección asistida: llegarás a donde quieres ir con menos molestias y una fracción del esfuerzo.

 

Resumen final

 

El mensaje clave en este libro:

 

Los algoritmos de aprendizaje automático son solucionadores de problemas universales que solo necesitan unos pocos supuestos y una gran cantidad de datos para hacer su magia. Unificar las ramas actuales del aprendizaje automático en un algoritmo maestro definitivo avanzaría a la humanidad como ningún otro evento en la historia. Incluso en la actualidad, los algoritmos avanzados y el acceso a los datos personales ya son cruciales para que las empresas sean competitivas.

 

Consejo práctico:

 

Tenga en cuenta su rastro de datos.

 

Cada interacción digital tiene dos niveles: obtener lo que quieres y enseñarle a la computadora un poco más sobre ti. El segundo será más importante a largo plazo, ya que se utilizará tanto para servirle, para ayudarlo a realizar tareas como para manipularlo, mostrándole anuncios y recomendaciones que probablemente lo hagan comprar. Así que ten cuidado. Si no desea que una sesión actual de Internet influya en su personalización, vaya al modo de incógnito. Y si no desea que a sus hijos se les muestren sugerencias y anuncios de YouTube basados ​​en su historial, asegúrese de usar diferentes cuentas.

 

¿Tienes comentarios?

 

¡Nos encantaría saber lo que piensas sobre nuestro contenido! ¡Simplemente envíe un correo electrónico a hola@epicurea.org con el título de este libro como asunto y comparta sus pensamientos!

 

Sugerido más lectura: Superinteligencia por Nick Bostrom

 

Superintelligence (2014) investiga cómo crear una máquina más inteligente que un humano cambiaría a la humanidad. Estas ideas están llenas de hechos, cifras y estudios de una variedad de disciplinas, lo que resulta en una imagen compleja del futuro superinteligente y cómo podríamos llegar allí.

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

También te pueden interesar

El líder introvertido

Kahnweiler explora los desafíos específicos que enfrentan los introvertidos en un mundo empresarial extrovertido. Luego se propone mostrar cómo los ejecutivos introvertidos pueden superar sus límites, emplear sus fortalezas características y aún convertirse en grandes líderes.

El material del pensamiento

The Stuff Of Thought (2007) ofrece una mirada profunda al lenguaje y, más específicamente, a lo que nos puede decir sobre la naturaleza humana y las complejidades de la mente humana. Este resumen toca todo, desde nuestra capacidad para detectar inconscientemente patrones gramaticales sutiles hasta las reglas lingüísticas que rodean la cortesía.

La paradoja de la longevidad

The Longevity Paradox (2019) analiza tres de los factores más cruciales detrás del envejecimiento: nuestras bacterias intestinales, nuestras paredes intestinales y nuestras mitocondrias. Al ayudarnos a comprender los roles que desempeñan estos factores en nuestra salud y al mostrarnos algunas estrategias poderosas que podemos adoptar para apoyarlos, el autor nos señala hacia una vida larga y saludable.

Titán

Titan (1998) es una biografía completa de John D. Rockefeller, Sr., el magnate petrolero original y fundador de Standard Oil, el nombre más importante de la industria a través del siglo XIX y principios del siglo XX. El libro cuenta la historia de Rockefeller desde su humilde infancia hasta que se convirtió en el hombre más rico de la historia estadounidense y su peculiar retiro. Proporciona una idea de la vida personal, las prácticas comerciales y los esfuerzos filantrópicos de Rockefeller.

¿Por qué dormimos?

Why We Sleep (2017) explora las últimas ideas científicas sobre la importancia del sueño. Explica lo que la privación del sueño hace a nuestras mentes y cuerpos, y ofrece algunos consejos para obtener un sueño de calidad, y más.

Las siete leyes espirituales del éxito

Las Siete Leyes Espirituales del Éxito (2007) trata sobre las fuerzas en el universo que pueden guiarte hacia el trabajo perfecto, una mayor riqueza y bienestar, relaciones sólidas y, lo más importante, la capacidad de disfrutar lo que tienes en este momento. ¡Descubre las siete leyes universales del éxito y aprovecha la energía infinita y la abundancia del universo!