嘉宾:卓克(《得到·科技参考》主理人)
理工科思维打造的方式
中国人在处理问题的时候,“差不多”思维导致在细节把控层面会反复修改,这就导致了我们质量的稳定性无法保证。这里有两个词,一是质量、二是稳定。特别是内卷时代,混个脸熟、做多面手的要求越来越多,一个方向很容易做到天花板,我们手中必须要有能力在多个赛道中奔跑。
从这一点上,理工科思维很重要。文科输出的内容大部分是口语内容,这种通过口口相传的内容稳定性不高,标准也相对宽泛,自然而然质量上总体比纸质版的要差。尽管现在所有的科学实验异化为了考试,但是我们仍然可以找机会,找时间,利用较低的成本把知识变成自身的素质。而且更重要的是,我们可以在“元问题”中寻找“元学习”的方式,这样的概念在理工科更好接受。
你认为什么东西是美的,可以亲近的。透露美感会吸引一部分、也会排斥一部分。理工科就是现实的利益,更有安全感,想要学好理工科思维,比较好的学习方法是真正从0开始解决问题,找到因果关系的构建方式。只要3次左右就成为一个理工科脑子了。
在读研究生的时候,有很多师兄师姐会给你留下趟好的路子,研习套路模式。单位不会给你尝试的机会。要解决很多细节问题,然后要建模,第一次第二次都不容易对,参考成熟的模式,我们的差距在哪里,你这么做为什么不成,他为什么要这么做?会经历整个模式之后,从这个具体功能之后再往后优化就可以做到的。有一个特殊的改进,对于公司来说是核心的。
如果说做下属的,不去找自己特殊方法,而只是套模板的人,比如编程的、前端开发都是做体力活的,最容易被AI取代,因为训练数据最丰富,从中找出最优的,从中得到bug更少,行数最短。最开始的别偷懒,别抄作业。你完全不懂的知识别自己骗自己。在做任何一件事的时候,别像其他人那样去应付,把自己所有的努力做出来就好了。反而,项目经理的工作界面是无法替代的。换句话说,要让人以需要感。
特别注意
社会中很多人在很多时候是不求甚解的,对于自己不懂的事情,就特别容易放弃抵抗,容易走到两个极端,要么就轻信比如说权威、比如说我喜欢的老师、我信任的大家等等,你说什么,我们就认为是什么。要么就不信,否定一切。如果能够赋予科学思维或学习的意义,日常当中我们可以用这种方式训练自己。成就感是最好的老师。
知识不是真理,并非永远正确
知识会随着时间、场景的变化而变化,很多时候的知识只是人们经验中的一个总结。所以,无论自诩为学习者还是研究者,我更期望能够在前面加一个定语“独立思考”。对知识的态度,一是要学习,二是要怀疑,在此基础上,找到知识发展的节奏同行,使我们接近知识背后理论的全貌。
另外一种,不要轻易把自己思考的逻辑链公布出去。很多时候我们想要说的,无论是学习方法、研究方法或者是其他的思考模式,它实际上背后牵扯的因素很多,包括我们自身的底层积累,人生经历、知识储备等等,很多时候都很灵活。单纯拿出去一个或几个出来形成一个看似完整的闭环效应,但背后还是会漏洞百出。
包括大语言模型在内的生成式模型都会产生让人类出现幻觉的内容,所以在生成式模型与我们工作生活发生嵌入的时候,人类角色之一就是要当这个最后的校准器。比如大语言模型中一个缺陷就是“没有细节”。在训练时,初始在内容结尾处的权重很重要,随着训练与反馈,前面的内容也很重要,这就导致中间很多细节都忽视了。这就是对大语言模型理性认知的第一层次。
如何在信息时代更新我们的信息检索能力?我觉得是以时间量级作为抓手,对于只需要知道结果的部分,使用Google, Bing都是在1~2s量级提供,这一方面大语言模型普遍在几十秒量级。
如何合理使用大语言模型
欲望提供了多样性,多样性提供了各种各样的可能。所以很多人就会迷失方向,特别是误认为大模型什么事情都能做。面对这类内容,我们需要的去做到这样的思维方式。
第一:要分析使用场景和任务是什么。比如说是自己的regulation,所有的工作都是在规章制度中的人基本用不到。而对于情感助手等把大语言模型作为助手的人。
第二:使用AI时,尽量不要使用推理功能。因为科研过程中我们已经有了一个很明显的推理逻辑,而用了推理功能,反而会胡说八道。
第三:利用神经网络滤出噪音应该是我们自身应当向AI学习的功能。
后记
- 理解噪音的本质:首先需要明确在你所关注的领域内,“噪音”指的是什么。在不同的上下文中,噪音可能代表实际的音频噪音、数据中的干扰信息或者是不必要的操作流程等。
- 数据收集与准备:为了训练一个能够有效滤除噪音的神经网络模型,你需要收集大量的相关数据。这些数据应涵盖各种可能的情况,包括有噪音和无噪音的情形,以便模型可以学习如何区分和处理它们。
- 选择合适的模型架构:根据你的应用需求选择或设计适合的神经网络架构。例如,对于音频处理任务,卷积神经网络(CNN)或循环神经网络(RNN)及其变种如长短期记忆网络(LSTM)可能会比较适用;而对于文本或图像去噪,则可能更倾向于使用深度卷积网络或其他特定结构。
- 训练模型:利用准备好的数据集对选定的模型进行训练。在此过程中,重要的是调整超参数并采用适当的正则化技术以防止过拟合。同时,确保有足够的验证数据来评估模型性能。
- 评估与优化:通过一系列测试来评估模型的效果,并基于反馈不断优化模型。这可能涉及到改进数据质量、调整模型架构或者改变训练策略等。
- 部署应用:一旦模型达到了满意的性能水平,就可以将其部署到实际应用场景中。比如,在智能家居系统中用于减少环境噪音影响,或是在企业环境中帮助员工专注于重要信息而忽略不相关的干扰。
- 持续监控与迭代更新:即使模型已经部署,也需要持续监控其表现,并定期更新模型以适应新的挑战和变化。