强化学习 - 星花园站长资源网

站长之家 2 月 27 日讯：据 36 氪消息，腾讯针对类ChatGPT对话式产品已成立“混元助手”项目组，该项目组将联合腾讯内部多方团队构建大参数语言模型，目标是“通过性能稳定

人工智能

听说你的多智能体强化学习算法不work？你用对MAPPO了吗

站长资讯网友投稿帖 发表于2024-06-25 浏览3565 评论0

清华和UC伯克利联合研究发现，在不进行任何算法或者网络架构变动的情况下，用 MAPPO（Multi-Agent PPO）在 3 个具有代表性的多智能体任务（Multi-Agent Particle World, StarCraftII, Hanabi）中取得了与 SOTA 算法相当的性能。

站长资讯

MIT开发新技术以解决机器人制作披萨面团的棘手挑战（可口的披萨要给机器人做吗）

站长资讯网友投稿帖 发表于2024-06-23 浏览4590 评论0

麻省理工学院（MIT）研究人员开发的一种新技术可以使机器人操纵像披萨面团这样柔软的物体或像衣服这样柔软的材料...他们创建了一个机器人操纵系统的框架，该系统使用两阶段

人工智能

淘宝：三万字深度分析强化学习在电商环境下的若干使用与研讨

站长资讯网友投稿帖 发表于2024-06-23 浏览3607 评论0

随着搜索技术的持续发展，我们已经逐渐意识到监督学习算法在搜索场景的局限性。与此同时，强化学习的深度学习化得到了空前的发展。结合淘宝的实践经验，用了近三万字深度剖析了强化学习在电商环境下的若干应用与研究！

人工智能

你该知道的深度强化学习相关常识

站长资讯网友投稿帖 发表于2024-06-22 浏览6303 评论0

在本文中，我们通过相关知识和算法的介绍，和您简要地讨论了如何将深度学习和强化学习融合在一起，产生所谓深度强化学习（Deep Reinforcement Learning，DRL），这一强大的AI系统。

人工智能

强化学习的10个实际使用

站长资讯网友投稿帖 发表于2024-06-22 浏览2951 评论0

在强化学习中，我们使用奖惩机制来训练agents。Agent做出正确的行为会得到奖励，做出错误的行为就会受到惩罚。这样的话，agent就会试着将自己的错误行为最少化，将自己的正确行为最多化。

站长资讯

NVIDIA: 仅两颗AI GPU就能在几天内完成芯片设计比10人团队干一年还要好

站长资讯网友投稿帖 发表于2024-06-21 浏览5149 评论0

因此，看到该公司将这两者结合起来，研发芯片设计的人工智能，最终的生产力可以比人类的工作高得多，未来这并不是一件令人奇怪的事情...根据NVIDIA首席科学家兼研究部高级副

人工智能

清华本科生开发强化学习渠道「天授」：千行代码完成，刚刚开源

站长资讯网友投稿帖 发表于2024-06-20 浏览6106 评论0

就在最近，一个简洁、轻巧、快速的深度强化学习平台，完全基于Pytorch，在Github上开源。

人工智能

如何用主动机器学习完成神经网络进化

站长资讯网友投稿帖 发表于2024-06-18 浏览6715 评论0

对大多数从事机器学习工作的人来说，设计一个神经网络无异于制作一项艺术作品。在本文中，我将介绍一个使用进化算法优化CNN超参数的例子。

业界资讯

阿斯顿大学研究人员希望借助AI交通灯系统大幅纾解交通拥堵

站长资讯网友投稿帖 发表于2024-06-17 浏览2798 评论0

此外交通拥堵造成的额外汽油消耗，平均也高达 19 加仑 —— 相当于每年损失 1600 亿美元的时间和燃料...本文要为大家介绍的，第 21 届 AAMAS 会议论文集中收录的、来自阿斯

人工智能

如何采用强化学习帮助选择客户更加关注的广告

站长资讯网友投稿帖 发表于2024-06-16 浏览5080 评论0

如今，全球的数字广告代理商每天都会在新闻网站、搜索引擎、社交媒体、视频流以及其他媒体平台上投放数以亿计的广告。他们都想解答一个问题：其产品目录中有哪些广告更能吸引特定的用户？当面对数以百计的网站、数以万计的广告以及数以百万的访问者时，获得这个问题的正确答案将会对企业增加收入产生巨大影响。

人工智能

强化学习在应用中寻找策略“最优解”

站长资讯网友投稿帖 发表于2024-06-12 浏览4131 评论0

强化学习(RL)是一种强大的人工智能技术，能够掌握复杂的策略以控制各类大规模复杂系统，包括制造流水线、交通控制系统(道路/火车/飞机)、金融资产以及机器人等等。如今，强化学习正由实验室环境一步步走向真正具备现实影响力的应用场景。

ZBlogIt

Nice to meet you, too!

Discuz Discuz! X1.5 DIY门户

https://www.cbdmd.com/cbd-gummies https...

业界资讯

消息称腾讯类ChatGPT产品已成立“混元助手”项目组

站长资讯网友投稿帖 发表于2024-06-25 浏览5755 评论0

人工智能

听说你的多智能体强化学习算法不work？你用对MAPPO了吗

站长资讯网友投稿帖 发表于2024-06-25 浏览3565 评论0

站长资讯

MIT开发新技术以解决机器人制作披萨面团的棘手挑战（可口的披萨要给机器人做吗）

站长资讯网友投稿帖 发表于2024-06-23 浏览4590 评论0

人工智能

淘宝：三万字深度分析强化学习在电商环境下的若干使用与研讨

站长资讯网友投稿帖 发表于2024-06-23 浏览3607 评论0

人工智能

你该知道的深度强化学习相关常识

站长资讯网友投稿帖 发表于2024-06-22 浏览6303 评论0

人工智能

强化学习的10个实际使用

站长资讯网友投稿帖 发表于2024-06-22 浏览2951 评论0

站长资讯

NVIDIA: 仅两颗AI GPU就能在几天内完成芯片设计比10人团队干一年还要好

站长资讯网友投稿帖 发表于2024-06-21 浏览5149 评论0

人工智能

清华本科生开发强化学习渠道「天授」：千行代码完成，刚刚开源

站长资讯网友投稿帖 发表于2024-06-20 浏览6106 评论0

人工智能

如何用主动机器学习完成神经网络进化

站长资讯网友投稿帖 发表于2024-06-18 浏览6715 评论0

业界资讯

阿斯顿大学研究人员希望借助AI交通灯系统大幅纾解交通拥堵

站长资讯网友投稿帖 发表于2024-06-17 浏览2798 评论0

人工智能

如何采用强化学习帮助选择客户更加关注的广告

站长资讯网友投稿帖 发表于2024-06-16 浏览5080 评论0

人工智能

强化学习在应用中寻找策略“最优解”

站长资讯网友投稿帖 发表于2024-06-12 浏览4131 评论0

« 2023年9月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30