- 一位女孩的一生!
你好,我是郭震(zhenguo)这一期,使用AI,生成一位女孩一生中12个重要时刻的图片,包括从出生,到长大,读中学,高中,大学,工作,结婚,生子,陪孩子长大... 下面附上大图:出生童年:中学:高中:大学:毕业工作:结婚:照顾小孩:为孩子缝补:送儿子上大学:孩子结婚了:看儿子的小孩:致敬!下期再见
- ChatGPT 更强更好用了!
你好,我是郭震(zhen guo)近日,ChatGPT发布新功能,让它变得更强,更好用了!支持多模态提问,如文本,图片,语音,PDF,Excel等输入形式。给它一篇Paper,返回对这篇Paper的解读。还有更加实用的一个重磅功能便是 GPTs,允许开发者调教自己的GPT,简单来说,就是可以定制专属
- 一个男孩的一生!
你好,我是郭震(zhen guo)人工智能AI可以做很多事情,它正在悄无声息改变着每个行业。下面是我使用AI生成的10幅图,刻画了一个男孩从出生到成人,工作,到结婚,再到逐渐变老,喜提金婚的一生。祝愿我们都能走好这一生!下面附录大图下期再见!
- 美国一桶牛奶多少钱?
你好,我是郭震(zhenguo)最近,关注我的朋友中有几位,想叫我多分享下美国的生活。今天我就从一个很小的生活点入手。牛奶,开始。牛奶在美国超市一般都是下面的这种大桶,比如Costco超市里,一般提供以下两种,口感有些不同,但是价格很相似。下面小票是我在8月31日去Costco超市,购买一桶上图红色
- 我们来美国一年了!
读者朋友们,你们好,我是郭震(zhen guo)「去年美国农场摘苹果,路过密西西比河」拍摄去年,我带着老婆孩子一起来到现在的城市,还记得,那是当地时间7月28日晚上8点多。一年过去,我想分享一下过去的一路心得,希望帮助到曾与我想法一样的读者朋友们,想有着工作几年后来美国继续深造。圣路易斯,不是大城市
- 机会来了!美国计算机博士名额,都是全奖!
你好,我是郭震(zhen guo)今天为关注我的读者朋友们,提供一个赴美读博深造的绝佳机会,都是全奖(免学费+每月几千刀工资)。更重要的是,导师王威,学识渊博,拥有很高的科研水平,N多篇计算机顶会论文,对学生负责、耐心。想申请的尽快给他发邮件,见文末。圣路易斯大学(Saint Louis Unive
- 该怎么做好一件事?
你好,我是郭震(zhenguo)我也一把年纪,经常回想年轻时做事的方法,现在看,当时做有些事,方法很傻。换成现在,我会放弃当时做事方法。年轻时,行动前,想这个,想那个,担心这个,担心那个,最后,都没开始,就已然无限拖延,最后不了了之。现在看来,想那么多干嘛,边想边做,边做边思考,有何不可?!!! 疑
- 今天去了一趟美国超市
同学们好,我是zhenguo(郭震)今天晚上去了一趟家附近的Costco超市,本来想去买一桶食用油,但顺便买了远不止是油。2桶植物油 12.99,西瓜6.99,这次终于将西瓜安置在箱子里,放在后备箱不用来回晃荡了!这种箱子Costco超市里可以随意使用。披萨9.98,晚上就不用做饭了!坚果9.9开心
- 第10篇:强化学习Q-learning求解迷宫问题 代码实现
你好,我是郭震(zhenguo)今天重新发布强化学习第10篇:强化学习Q-learning求解迷宫问题 代码实现我想对此篇做一些更加详细的解释。1 创建地图创建迷宫地图,包括墙网格,走到墙网格就是负奖励。注意:空白可行走网格奖励值设置为负数,比如-1, 是为减少路径中所经点数;如果设置为大于0的奖励
- 第十二篇:强化学习SARSA算法
你好,我是郭震(zhenguo)今天强化学习第二十篇:强化学习SARSA算法1 历史SARSA(「State-Action-Reward-State-Action」)算法是一种经典的强化学习算法,用于解决马尔可夫决策过程(MDP)问题。该算法于1994年由美国计算机科学家Rummery和Niranj
- 第八篇:强化学习值迭代及代码实现
你好,我是郭震(zhenguo)前几天我们学习强化学习策略迭代,今天,强化学习第8篇:强化学习值迭代值迭代是强化学习另一种求解方法,用于找到马尔可夫决策过程(MDP)中的最优值函数。值迭代值迭代可以总结为如下几点:值迭代通过不断迭代更新值函数来逼近最优值函数,从而确定最优策略。值迭代的关键是在每次迭
- 第六篇:强化学习策略迭代 通俗解释
你好,我是zhenguo(郭震)今天,介绍强化学习第6篇:策略迭代策略迭代是马尔可夫决策过程(MDP)中的一种求解方法,当然也是强化学习常用求解方法。它的思想可以用通俗的方式解释如下:假设你正在玩一个迷宫游戏,目标是找到迷宫的出口。你每到达一个迷宫的某个位置,都需要根据当前的状态(位置)来选择一个行
- 第五篇:强化学习基础之马尔科夫决策过程
你好,我是zhenguo(郭震)今天总结强化学习第五篇:马尔科夫决策过程基础马尔科夫决策过程(MDP)是强化学习的基础之一。下面统一称为:MDPMDP提供了描述序贯决策问题的数学框架。它将决策问题建模为:状态、动作、转移概率和奖励的组合,并通过优化累积奖励的目标来找到最优的决策策略。详细来说,MDP
- 复习强化学习过往四篇
你好,我是zhenguo(郭震)今天,希望大家复习一下强化学习过往四篇,我会在第五篇介绍马尔科夫决策过程第一篇:强化学习基本原理通俗介绍第二篇:强化学习中的7个基础概念第三篇:强化学习发展历史第四篇:强化学习的应用领域和案例你的点赞和转发,给我更新增加更大动力,感谢你的支持。
- 强化学习的应用领域和案例
你好,我是zhenguo(郭震)今天总结强化学习第四篇:强化学习的应用领域第一:游戏领域。强化学习在游戏领域有很多应用,如围棋、象棋、扑克等游戏的AI对战。例如,AlphaGo使用强化学习技术,在围棋比赛中击败了人类世界冠军。AlphaGo在对阵李世石的第二局中做出的传奇落子动作。这手落子震惊了许多
- 第三篇:强化学习发展历史
你好,我是zhenguo(郭震)这是强化学习第三篇,我们回顾一下它的发展历史:强化学习发展历史强化学习作为一门研究领域,经历了多年的发展和演进。以下是强化学习的主要发展历史里程碑:1950年代-1960年代康奈尔大学的康奈尔Aeronautical Laboratory (CAL) 开展了早期的多智
- 第二篇:强化学习中的7个基础概念
你好,我是zhenguo(郭震)这是强化学习第二篇:强化学习7个基础概念在强化学习中,智能体需要在不断尝试和错误的过程中学习,通过观察环境的反馈(奖励或惩罚)来调整自己的行为,从而逐步改进策略。强化学习常见的概念,结合迷宫游戏给大家阐述一下。第一,红点表示智能体,它在迷宫这个环境中玩耍:第二,环境,
- 我将开始更新 强化学习
你好,我是zhenguo(郭震)很久没有更新文章,从现在开始我将逐步恢复更新。在接下来的日子,我将系统更新强化学习文章,在期间,也会插播一些读博做科研的一些日常总结。如果你感兴趣,欢迎关注学习。写公众号文章,是沉淀技术非常好的一种方法,希望更多朋友参与进来。精进技术,脚踏实地,永远不过时。下面是强化