- 分类:
- 人工智能
-
- Paddle2.0-AI图像安全-图像对抗样本初探-常见攻击策略
- 本文介绍图像对抗样本的三种常见攻击策略:FGSM、BIM和PGD,附Paddle实现代码(见Paddle-Adversarial-Toolbox仓库)。FGSM通过梯度符号快速生成扰动;BIM为其迭代改进版,提升成功率;PGD在BIM基础上增加迭代轮数和随机化处理,增强攻击效果。
- 人工智能 . 科技周边 406 2025-07-31 10:53:59
-
- 情人节:借助二次元老婆研究特征解耦
- 本项目旨在实现二次元头像的特征解耦,让B头像风格影响A头像主体且保持A大体不变。采用Konachan动漫头像数据集,基于SPADE架构,A为内容主体,B为风格。通过Encoder-Decoder提取特征,利用KLDLoss、VGG损失等训练,使生成图融合A主体与B风格,测试显示能体现特征影响差异。
- 人工智能 . 科技周边 344 2025-07-31 10:52:19
-
- 深度学习三步走(二)网络篇
- 本文介绍卷积神经网络(CNN),涵盖其包含的卷积层、ReLU层等各类层及相关运算、参数计算等,还讲解激活函数、BatchNorm层、Dropout,列举LeNet等经典网络,提及CNN改进思路,从优化指标和通用方法等方面阐述如何优化CNN。
- 人工智能 . 科技周边 418 2025-07-31 10:50:46
-
- PaddleSeg代码解读-数据增强与模型结构解读
- 本文是PaddleSeg代码解读第二篇,先解读数据增强代码,介绍了transforms中Compose等多个预处理与增强类的实现,它们通过__call__方法运作。再解读模型与Backbone代码,以FCN网络为例,介绍其结构及HRNet主干网络的构成模块与运作方式。
- 人工智能 . 科技周边 260 2025-07-31 10:48:24
-
-
- 文字识别:基于PaddlePaddle复现PANet
- 该论文提出PAN网络,以ResNet-18为骨干,结合FPEM、FFM和像素聚合法,平衡场景文本检测的精度与速度。基于Paddle的复现项目,部分数据集F-measure达81.46%,超验收标准。
- 人工智能 . 科技周边 803 2025-07-31 10:41:43
-
- 科大讯飞-人脸关键点检测挑战赛:进阶思路预训练模型 MAE 1.2
- 该内容为一场人脸关键点检测竞赛的解决方案。使用5千张带标注的人脸图像训练模型,识别4个关键点。采用ResNet18模型,调整输入层和输出层适配单通道图像及8个坐标值。通过数据扩增、K折交叉验证训练多模型,最终集成预测,以MAE评估性能,提升检测精度。
- 人工智能 . 科技周边 649 2025-07-31 10:40:04
-
- 【AI达人特训营第三期】Conv2Former:一种ViT风格的卷积模块
- 本文复现了Conv2Former模型,其采用Transformer风格的QKV结构,以卷积生成权重加权,平衡全局信息提取与计算开销。在CIFAR-10数据集上,用Conv2Former-N参数({64,128,256,512}维度,{2,2,8,2}深度)训练50个epoch,验证集准确率达82%,参数884万,优于Swin-T的75%准确率与2753万参数,展现出设计优越性。
- 人工智能 . 科技周边 912 2025-07-31 10:38:38
-
- 如何通过夸克AI大模型生成API文档 夸克AI大模型代码注释与文档写作
- 如何准备代码注释以获得最佳的API文档生成效果?1.每个函数、类、方法都应有清晰注释,包含功能、参数、返回值、异常说明;2.使用标准文档注释格式如Javadoc或Sphinx,帮助模型理解结构;3.注释内容越详细,生成的文档越完善,例如Python函数应明确参数类型和逻辑说明。
- 人工智能 . 科技周边 606 2025-07-31 10:36:02
-
- 如何靠夸克AI大模型创建知识星球盈利 夸克AI大模型社群付费内容生成
- 明确细分领域,如“AI工具赋能个人品牌建设”,精准击中用户痛点;2.构建“AI+人工”流程:你主导选题与Prompt设计,AI生成初稿,你再事实核查、注入经验、优化逻辑与表达;3.多模态转化内容为PPT、音频、短视频脚本提升形式多样性;4.通过活跃社群互动、定期分享强化价值感知实现留存与口碑;5.定价采用订阅制,初期低价引流,后期随价值提升涨价,持续提供超预期价值才是盈利根本。
- 人工智能 . 科技周边 1029 2025-07-31 10:35:01
-
- 点云生成:基于Paddle2.0实现WGAN-GP在点云上的一些尝试
- 本文尝试在点云上应用WGAN-GP,判别器借鉴PointNet结构,生成器为自定义搭建。使用ModelNet40数据集,取1024个点训练。定义了FeatureNet、UFeatureNet等网络,通过Adam优化器训练,每2轮可视化生成结果,20轮保存模型,目前可运行但效果待提升。
- 人工智能 . 科技周边 1033 2025-07-31 10:34:51
-
- Higgs Audio V2— 开源语音大模型,能模拟多人互动场景
- HiggsAudioV2是什么HiggsAudioV2是由李沐及其领导的BosonAI团队推出的一款开源语音大模型。该模型基于超过1000万小时的海量音频数据进行训练,具备多语言对话生成、自动韵律控制、语音克隆以及歌声合成等多项先进功能。它能够逼真模拟多人之间的自然对话,智能匹配说话人的情绪与语调变化,支持低延迟的实时语音交互体验。模型支持零样本语音克隆,用户仅需提供一段简短的语音片段,即可复现特定人物的声音特征,并可用于演唱合成。此外,HiggsAudioV2还能同步生成语音与
- 人工智能 . 科技周边 649 2025-07-31 10:32:03
-
- deepseek目标定位技巧 deepseek怎么分析院校难度
- 要让DeepSeek给出更精准的院校推荐,首先要明确自身需求并提供详尽且结构化的背景信息,包括学术成绩、科研实习经历、个人兴趣及未来规划;2.提问时要细化输入内容,避免模糊表述,结合具体绩点、项目成果、专业课程表现等信息,帮助DeepSeek进行多维度加权分析;3.充分利用其多轮对话能力,通过追问和补充细节不断修正和深化分析,使推荐更贴合实际意图;4.在分析院校难度时,DeepSeek会综合考虑非量化因素,如学科声誉、师资力量、毕业生去向、校友资源及校园文化等,并通过关联文本信息间接评估其影响力
- 人工智能 . 科技周边 347 2025-07-31 10:31:01
-
- 如何让豆包AI帮忙编程 豆包AI代码辅助教学
- 豆包AI能有效辅助编程学习和问题解决。对于代码卡壳问题,可直接描述需求获取示例代码并理解逻辑;针对报错信息,复制错误提示及上下文代码能让豆包AI快速定位原因并提供修改建议;在逻辑设计方面,通过提问结构安排(如登录系统的设计),可获得清晰的程序框架;高效使用的关键在于精准提问,明确任务细节与环境条件,从而提升学习效率与代码质量。
- 人工智能 . 科技周边 539 2025-07-31 10:19:01
-
- 【AI达人特训营】多模型集成学习的艺术作品作者识别
- 该项目借助多模型集成学习识别艺术作品作者。使用PaddleClas训练ResNet50_vd、VGG16和PPLCNetV2模型,基于含49位作者、7226张图片的Art数据集,经数据处理后划分训练集和验证集。通过硬投票集成模型结果,可纠正单一模型错误,提升识别效果,如成功识别Edgar Degas和Rembrandt的作品。
- 人工智能 . 科技周边 1039 2025-07-31 10:17:50
PHP讨论组
组员:3305人话题:1500
PHP一种被广泛应用的开放源代码的多用途脚本语言,和其他技术相比,php本身开源免费; 可以将程序嵌入于HTML中去执行, 执行效率比完全生成htmL标记的CGI要高许多,它运行在服务器端,消耗的系统资源相当少,具有跨平台强、效率高的特性,而且php支持几乎所有流行的数据库以及操作系统,最重要的是

