嘉宾：卓克（《得到·科技参考》主理人）

理工科思维打造的方式

中国人在处理问题的时候，“差不多”思维导致在细节把控层面会反复修改，这就导致了我们质量的稳定性无法保证。这里有两个词，一是质量、二是稳定。特别是内卷时代，混个脸熟、做多面手的要求越来越多，一个方向很容易做到天花板，我们手中必须要有能力在多个赛道中奔跑。

从这一点上，理工科思维很重要。文科输出的内容大部分是口语内容，这种通过口口相传的内容稳定性不高，标准也相对宽泛，自然而然质量上总体比纸质版的要差。尽管现在所有的科学实验异化为了考试，但是我们仍然可以找机会，找时间，利用较低的成本把知识变成自身的素质。而且更重要的是，我们可以在“元问题”中寻找“元学习”的方式，这样的概念在理工科更好接受。

你认为什么东西是美的，可以亲近的。透露美感会吸引一部分、也会排斥一部分。理工科就是现实的利益，更有安全感，想要学好理工科思维，比较好的学习方法是真正从0开始解决问题，找到因果关系的构建方式。只要3次左右就成为一个理工科脑子了。

在读研究生的时候，有很多师兄师姐会给你留下趟好的路子，研习套路模式。单位不会给你尝试的机会。要解决很多细节问题，然后要建模，第一次第二次都不容易对，参考成熟的模式，我们的差距在哪里，你这么做为什么不成，他为什么要这么做？会经历整个模式之后，从这个具体功能之后再往后优化就可以做到的。有一个特殊的改进，对于公司来说是核心的。

如果说做下属的，不去找自己特殊方法，而只是套模板的人，比如编程的、前端开发都是做体力活的，最容易被AI取代，因为训练数据最丰富，从中找出最优的，从中得到bug更少，行数最短。最开始的别偷懒，别抄作业。你完全不懂的知识别自己骗自己。在做任何一件事的时候，别像其他人那样去应付，把自己所有的努力做出来就好了。反而，项目经理的工作界面是无法替代的。换句话说，要让人以需要感。

特别注意

社会中很多人在很多时候是不求甚解的，对于自己不懂的事情，就特别容易放弃抵抗，容易走到两个极端，要么就轻信比如说权威、比如说我喜欢的老师、我信任的大家等等，你说什么，我们就认为是什么。要么就不信，否定一切。如果能够赋予科学思维或学习的意义，日常当中我们可以用这种方式训练自己。成就感是最好的老师。

知识不是真理，并非永远正确

知识会随着时间、场景的变化而变化，很多时候的知识只是人们经验中的一个总结。所以，无论自诩为学习者还是研究者，我更期望能够在前面加一个定语“独立思考”。对知识的态度，一是要学习，二是要怀疑，在此基础上，找到知识发展的节奏同行，使我们接近知识背后理论的全貌。

另外一种，不要轻易把自己思考的逻辑链公布出去。很多时候我们想要说的，无论是学习方法、研究方法或者是其他的思考模式，它实际上背后牵扯的因素很多，包括我们自身的底层积累，人生经历、知识储备等等，很多时候都很灵活。单纯拿出去一个或几个出来形成一个看似完整的闭环效应，但背后还是会漏洞百出。

包括大语言模型在内的生成式模型都会产生让人类出现幻觉的内容，所以在生成式模型与我们工作生活发生嵌入的时候，人类角色之一就是要当这个最后的校准器。比如大语言模型中一个缺陷就是“没有细节”。在训练时，初始在内容结尾处的权重很重要，随着训练与反馈，前面的内容也很重要，这就导致中间很多细节都忽视了。这就是对大语言模型理性认知的第一层次。

如何在信息时代更新我们的信息检索能力？我觉得是以时间量级作为抓手，对于只需要知道结果的部分，使用Google, Bing都是在1~2s量级提供，这一方面大语言模型普遍在几十秒量级。

如何合理使用大语言模型

欲望提供了多样性，多样性提供了各种各样的可能。所以很多人就会迷失方向，特别是误认为大模型什么事情都能做。面对这类内容，我们需要的去做到这样的思维方式。

第一：要分析使用场景和任务是什么。比如说是自己的regulation，所有的工作都是在规章制度中的人基本用不到。而对于情感助手等把大语言模型作为助手的人。

第二：使用AI时，尽量不要使用推理功能。因为科研过程中我们已经有了一个很明显的推理逻辑，而用了推理功能，反而会胡说八道。

第三：利用神经网络滤出噪音应该是我们自身应当向AI学习的功能。

后记

理解噪音的本质：首先需要明确在你所关注的领域内，“噪音”指的是什么。在不同的上下文中，噪音可能代表实际的音频噪音、数据中的干扰信息或者是不必要的操作流程等。
数据收集与准备：为了训练一个能够有效滤除噪音的神经网络模型，你需要收集大量的相关数据。这些数据应涵盖各种可能的情况，包括有噪音和无噪音的情形，以便模型可以学习如何区分和处理它们。
选择合适的模型架构：根据你的应用需求选择或设计适合的神经网络架构。例如，对于音频处理任务，卷积神经网络（CNN）或循环神经网络（RNN）及其变种如长短期记忆网络（LSTM）可能会比较适用；而对于文本或图像去噪，则可能更倾向于使用深度卷积网络或其他特定结构。
训练模型：利用准备好的数据集对选定的模型进行训练。在此过程中，重要的是调整超参数并采用适当的正则化技术以防止过拟合。同时，确保有足够的验证数据来评估模型性能。
评估与优化：通过一系列测试来评估模型的效果，并基于反馈不断优化模型。这可能涉及到改进数据质量、调整模型架构或者改变训练策略等。
部署应用：一旦模型达到了满意的性能水平，就可以将其部署到实际应用场景中。比如，在智能家居系统中用于减少环境噪音影响，或是在企业环境中帮助员工专注于重要信息而忽略不相关的干扰。
持续监控与迭代更新：即使模型已经部署，也需要持续监控其表现，并定期更新模型以适应新的挑战和变化。

《长谈》观看笔记（3）：刻意训练对知识批判性学习的能力

理工科思维打造的方式

特别注意

知识不是真理，并非永远正确

如何合理使用大语言模型

后记

发表评论取消回复

Skylighter | 向光者

阅览提示

理工科思维打造的方式

特别注意

知识不是真理，并非永远正确

如何合理使用大语言模型

后记

发表评论 取消回复

发表评论取消回复