知行合一如何从0开始设计一个MLP平常我们在复现论文、搭建模型时,经常会遇到多层感知机(MLP)。很多时候我们只是照搬代码,却很少思考:MLP的结构是怎么设计的?各层顺序有什么讲究?超参数该如何确定?又该如何根据自身任务场景优化模型、判断某一层是否必要?今天就结合一个具体的PyTorch MLP示例,一步步拆解从设计、调参到优化的全流程。 DL 开发 思考 精选
知行合一机器学习常用激活函数及其选型本文按照激活函数的发展脉络,对深度学习中常用的激活函数进行了系统整理,涵盖其数学公式、取值范围、核心特点、PyTorch公式级实现代码、适用场景、出现背景(解决的具体问题)以及计算复杂度和参数情况等信息。通过这种方式,可以从工程和理论两个角度快速理解不同激活函数的设计动机与应用差异,帮助在实际模型设计(如推荐系统、CV、LLM 等)中进行合理选型。 DL NLP LLM 开发 教程 思考 精选
知行合一机器学习常用损失函数及其选型在机器学习与深度学习实践中,损失函数(Loss Function)是连接模型预测与优化目标的核心组件,它定义了模型“什么样的预测是好的”。不同任务(如回归、分类、排序或表征学习)对应的损失函数形式和优化目标也各不相同,因此合理选择损失函数往往对模型效果具有决定性影响。本文整理了工程与论文中常见的损失函数,并按照回归、分类(Pointwise)、排序(Pairwise/Listwise)以及表征学习等典型任务场景进行分类,总结其数学形式、核心思想和适用条件,帮助读者在实际建模与系统设计中快速理解各类损失函数的作用及选型依据。 DL NLP ST LLM 思考 精选
技术分享主流Serverless平台免费额度 良心大PK近些年Edge Serverless(或 Edge Compute / Edge Functions)平台越来越多,从AWS Lambda, Azure Functions,到“大善人”的 Cloudflare Workers,几乎成了做轻量后端、API、中转服务时最佳实践。 那么,哪个 Serverless 平台免费额度最良心?、是否够个人/小型项目使用?、如果后续项目扩张,将怎么收费? 这篇文章就简单整理一下目前几个主流平台——Cloudflare Workers、AWS Lambda 和 Azure Functions 的免费额度情况,给准备上手或正在对比的平台一个参考。 工具 开发 精选