Abordagem em dois estágios
O sistema de recomendação do YouTube funciona em dois estágios:
- Geração de candidatos: Neste estágio, o sistema identifica um pequeno número de vídeos que podem ser relevantes para o usuário, com base em seu histórico de exibição, outros recursos, como histórico de pesquisa, dados demográficos e idade do vídeo.
- Classificação: Neste estágio, o sistema classifica os vídeos candidatos em ordem de relevância, com base em fatores como o tempo de exibição esperado, a taxa de cliques e o engajamento do usuário.
Filtragem colaborativa profunda
O modelo de geração de candidatos usa uma rede neural profunda para aprender incorporações de usuários. Uma incorporação é uma representação matemática de um usuário ou vídeo que captura informações importantes sobre ele. No caso do usuário, a incorporação pode capturar coisas como seus interesses, preferências e hábitos de visualização. No caso do vídeo, a incorporação pode capturar coisas como seu conteúdo, tema e linguagem.
A rede neural aprende as incorporações dos usuários usando um processo chamado aprendizado de máquina. Nesse processo, a rede neural é treinada com um conjunto de dados de históricos de exibição de usuários. A rede neural aprende a associar padrões no histórico de exibição com interesses e preferências dos usuários.
Sinais heterogêneos
Além das incorporações de vídeo, o modelo de geração de candidatos também incorpora outros recursos, como histórico de pesquisa, dados demográficos e idade do vídeo. Isso ajuda a melhorar a precisão e a personalização das recomendações.
Por exemplo, se um usuário pesquisar por “receitas de bolo”, o sistema pode recomendar vídeos de receitas de bolo, mesmo que o usuário não tenha assistido a nenhum vídeo de receitas anteriormente. Isso ocorre porque o sistema pode usar o histórico de pesquisa do usuário como um sinal de que ele está interessado em receitas de bolo.
Seleção de rótulos e contexto
A escolha do que prever e quais informações fornecer ao modelo de geração de candidatos afeta significativamente o desempenho. Por exemplo, prever futuras visualizações é uma estratégia eficaz, pois permite que o sistema se concentre em vídeos que os usuários provavelmente assistirão.
O contexto também é importante. Por exemplo, se o usuário estiver assistindo a um vídeo de receitas de bolo, o sistema pode recomendar vídeos de receitas de bolo semelhantes.
Classificação com tempo de exibição esperado
O modelo de classificação usa outra rede neural profunda para prever o tempo de exibição esperado para cada impressão de vídeo. Isso ajuda a garantir que o sistema recomende vídeos que os usuários provavelmente assistirão por um longo tempo.
O tempo de exibição esperado é calculado com base em fatores como o histórico de exibição do usuário, as incorporações do vídeo e o contexto da impressão.
Engenharia e normalização de recursos
A engenharia e normalização adequadas de recursos são cruciais para um treinamento e generalização eficazes. Por exemplo, os recursos podem ser transformados para que tenham uma distribuição mais uniforme, o que ajuda a melhorar o desempenho do modelo.
Conclusão
O sistema de recomendação do YouTube usa uma abordagem complexa e sofisticada para recomendar vídeos aos usuários. O uso de redes neurais profundas, sinais heterogêneos e cuidadosas escolhas de design contribuem para o sucesso do sistema.
Explicação para leigos
Vamos imaginar que você está assistindo a um vídeo do YouTube sobre como fazer bolo. Depois de terminar de assistir ao vídeo, o YouTube recomenda outros vídeos sobre bolos. Como o YouTube sabe que você está interessado em bolos?
O YouTube usa um sistema de recomendação que analisa seu histórico de exibição, outras informações sobre você, como seus dados demográficos, e o conteúdo dos vídeos que você assiste. Com base nessas informações, o YouTube pode prever quais vídeos você provavelmente vai gostar.
O sistema de recomendação do YouTube é dividido em dois estágios:
- Geração de candidatos: Neste estágio, o sistema identifica um pequeno número de vídeos que podem ser relevantes para você.
- Classificação: Neste estágio, o sistema classifica os vídeos candidatos em ordem de relevância.
No estágio de geração de candidatos, o YouTube usa uma rede neural profunda para aprender suas incorporações. Uma incorporação é uma representação matemática de você que captura informações importantes sobre seus interesses e preferências.
No estágio de classificação, o YouTube usa outra rede neural profunda para prever o tempo de exibição esperado para cada vídeo candidato. O tempo de exibição esperado é calculado com base em seu histórico de exibição, suas incorporações e o contexto da impressão.
O sistema de recomendação do YouTube é uma tecnologia complexa, mas é essencial para que o YouTube ofereça uma experiência personalizada para seus usuários.