Iniciativas para mejorar el Machine Learning basadas en datos abiertos

Cómo funciona el machine learning

El aprendizaje automático machine learning favorece el progreso en el campo de las nuevas tecnologías, especialmente en el desarrollo de herramientas que facilitan tareas y labores concretas. Así, han surgido aplicaciones como el Chat GPT-3, el cual genera y desarrolla contenido variado.

Estas herramientas basan su funcionamiento en un repositorio de datos almacenados, que emplean y procesan para dar respuesta a las tareas que se les plantean, aprendiendo a su vez de ellos con cada actividad que realizan. Los datos abiertos, por tanto, son de vital importancia, ya que retroalimentan este proceso (cumpliendo una labor de “entrenamiento” para dichas aplicaciones).

Existen iniciativas que fomentan la inversión de recursos en las nuevas tecnologías, como el Programa Digital Europe o Gaia-X, que hemos comentado en otras ocasiones. Se suman a estos proyectos, dado el conocimiento de diversas organizaciones del potencial de estas herramientas, el desarrollo de otros sistemas y aplicaciones que aportan su granito de arena.

Aplicaciones basadas en datos abiertos que refuerzan el machine learning

Estas son tres de las aplicaciones más notables desarrolladas por una o varias empresas para favorecer y facilitar el trabajo del aprendizaje automático:

  1. ML Commons: ofrece una serie de aplicaciones que emplean los algoritmos de código abierto existentes para el machine learning.  Gracias a ellos, los ingenieros reducen las labores de gestión de otras funciones. Así, se facilita la realización de diversas tareas, reforzando directa e indirectamente su impacto positivo en otros procesos.  Estos procedimientos requieren, como comentábamos antes, de un repositorio de datos que, además, estén actualizados. Google, Dell o Microsoft se encuentran entre los fundadores de ML Commons.
  2. Datacommons: con el objetivo de crear una asociación de datos abiertos que beneficioso para el machine learning, Datacommons realiza una filtración de dichos datos que aumenta su utilidad. Mediante la integración de datos de diferentes sectores, desde el ámbito económico al científico, genera un gráfico unificado de datos útiles para el aprendizaje automático. Este repositorio de datos es almacenado por Google.
  3. Papers with Code: se trata de una plataforma donde cualquier usuario puede aportar datos, tablas, métodos y cualquier otro tipo de material con el fin de contribuir al desarrollo de estos sistemas innovadores. Esta plataforma gestiona y facilita el acceso a los documentos, incluyendo el software que permite visualizarlos.

 

Fuente: https://administracionelectronica.gob.es

¿Necesitas más información?

Nuestros canales de Telegram

Disponemos de un canal dedicado a cada oposición. Selecciona el que te interesa.