QUIERES COMPRAR EN EL PRIME DAY? SUSCRÍBETE. 30 DÍAS GRATIS

April 16, 2021

Horizon, es la plataforma de aprendizaje de refuerzo de código abierto de Facebook

El sistema se ha utilizado para personalizar M sugerencias, personalizar notificaciones y optimizar el video. Facebook publicó un documento en el que presenta Horizon, la plataforma de aprendizaje de refuerzo de fuente abierta (RL) de Facebook. Horizon es una plataforma de extremo a extremo diseñada para resolver problemas de RL aplicados en la industria donde los conjuntos de datos son grandes (de millones a miles de millones de observaciones), el bucle de retroalimentación es lento (frente a un simulador), y los experimentos deben realizarse con cuidado porque no No se ejecuta en un simulador. A diferencia de otras plataformas RL, que a menudo están diseñadas para la creación rápida de prototipos y la experimentación, Horizon está diseñado con los casos de uso de producción como una prioridad. La plataforma contiene flujos de trabajo para entrenar algoritmos RL profundos populares e incluye preprocesamiento de datos, transformación de características, capacitación distribuida, evaluación de políticas contrafactual y servicio optimizado. También muestra ejemplos reales de los modelos entrenados con Horizon que superaron significativamente y reemplazaron a los sistemas de aprendizaje supervisado en Facebook. Fuente: Facebook [gallery]]]>