强化学习

在给定的数据环境下,让智能体学习如何选择一系列行动,来达成长期累计收益最大化目标的机器学习方法

    文章内容由AI百科使用AI进行创作,转载请注明出处:https://www.aipedia.cn/archives/4314.html

    (0)
    上一篇 2023年7月6日
    下一篇 2023年7月6日

    推荐词条

    • 吴文俊 (Wenjun Wu)

      吴文俊是中国科学院院士,被誉为中国的”人工智能之父”。他是中国人工智能研究的奠基人之一,对模式识别、机器学习等领域做出了重要贡献。吴文俊提出了一系列的模式识别算法和方法,为中国的人工智能研究和应用奠定了基础。他还积极推动人工智能的发展,培养了大批优秀的人工智能科学家和工程师。

      2023年7月6日
      81
    • 伊恩·古德费洛(Ian Goodf)

      伊恩·古德费洛(Ian Goodfellow)是一位著名的计算机科学家,他的研究领域主要是深度学习和人工智能。他是斯坦福大学(Stanford University)计算机科学系的助理教授,同时也是谷歌(Google)Brain团队的研究员。 伊恩·古德费洛最著名的贡献之一是提出了生成对抗网络(Generative Adversarial Networks,…

      2023年7月4日
      364
    • ViT

      Vision Transformer ,视觉变换器。一种利用 Transformer 解决计算机视觉问题的模型

      2023年7月7日
      247
    • 感知器

      一种最简易的人工神经网络模型

      2023年7月6日
      76
    • 约书亚·本吉奥 (Joshua Bengio)

      约书亚·本吉奥是加拿大蒙特利尔大学计算机科学系教授,也是MILA实验室的主任。他是深度学习领域的知名专家,被誉为深度学习的三巨头之一。本吉奥在深度学习算法和模型方面做出了重要贡献,他的研究成果包括提出了深度置信网络(DBN)和生成对抗网络(GAN)等重要模型。他的工作推动了深度学习在自然语言处理、推荐系统等领域的应用。

      2023年7月6日
      93
    关注微信