【NIPS】LLVM IR数据集论文 | 逸翎清晗🌈
文章
233
标签
44
分类
54
首页
文章
归档
标签
分类
专区与和合辑
多媒体资料专区
论文导读专区
学术会议专区
推荐学习资料专区
学习路线专区
编译器
操作系统
集成电路
AI编译
大语言模型
程序设计
计算理论
分布式
后台
画廊
统计
休闲
旧时光
个人
关于
逸翎清晗🌈
首页
文章
归档
标签
分类
专区与和合辑
多媒体资料专区
论文导读专区
学术会议专区
推荐学习资料专区
学习路线专区
编译器
操作系统
集成电路
AI编译
大语言模型
程序设计
计算理论
分布式
后台
画廊
统计
休闲
旧时光
个人
关于
PAGE_NAME
搜索
【NIPS】LLVM IR数据集论文
发表于
2025-03-20
|
更新于
2025-08-28
|
论文
个人
|
字数总计:
14
|
阅读时长:
1分钟
|
阅读量:
受到访问权限限制,请注明来意
【NIPS】LLVM IR数据集论文
https://yangzi.world/blog/posts/31480576.html
作者
逸翎清晗🌈
发布于
2025-03-20
更新于
2025-08-28
许可协议
CC BY-NC-SA 4.0
投喂作者
微信
支付宝
上一篇
构建——如何交叉构建host是其他架构的LLVM
下一篇
LLMRA论文
评论
目录
正式笔记
本数据集的目的和意义是什么?
如何设计下游任务以凸显你的动机?(打动评审?)
如何将实验设计和数据指标结合?
提供什么样的工具链?
这篇论文对编译器社区的作用怎么讲?
阐释:大家都在做“表示 IR”和“理解 IR”,为啥我要做“丰富 IR、特定优化 IR”?
怎样证明“让模型优化 IR”这件事,大家确实需要?
为什么我这篇论文和传统开发类任务不同?
你这个数据集和别人的有区别吗?人家只不过是未优化的IR数据集,规模还比你大,人家的子集说不定就能达到你的效果
没有性能数据,优化说服力不够
没有考虑现实中的程序性能差异
你这个测试的时候选同样的文件数,那不是函数越大就包含更多pass覆盖率?实验不标准啊?
杂合内容
动机
贡献
新指标:
“多维度优化差异度”(Multi-Dimensional Optimization Diversity, MDOD)
参考论文(结构)
功能
数据库功能性支持
工具链支持
参考文献
工作清单
新 Metric
IRIE
🧨 ① 审稿人的尖锐质疑
🛠️ ② 具针对性的改进:IRIE‑v2(层级化熵 + 归一化 + 语义加权)
📈 ③ 如何实现(仅需 2 步)
📝 ④ 在论文/数据卡中这样写
CFGEntropy
🧨 审稿人的尖锐批评:CFG Entropy 的不足
🛠️ 自我修正和优化:CFG Entropy 的改进
1️⃣ 增强控制流图熵的动态计算:执行代价和路径深度
批评回应:
改进方法:引入路径深度、循环结构以及基本块执行代价
改进后的公式:
2️⃣ 考虑执行顺序和依赖关系:跳转的动态特性
批评回应:
改进方法:引入数据依赖关系和跳转路径的动态特性
改进后的公式:
3️⃣ 考虑多种控制结构和语义
批评回应:
改进方法:引入控制结构分类和权重
改进后的公式:
4️⃣ 考虑与其他复杂度指标的融合
批评回应:
改进方法:结合多个复杂度指标
改进后的公式:
结构性异质性 (SD)
🧨 审稿人批评:结构性异质性 (SD) 的不足
🛠️ 自我修正和优化:结构性异质性(SD)的改进方案
1️⃣ 引入多层次的结构性分析:从低级到高级的结构分析
批评回应:
改进方案:引入低级结构与高级结构的分析
2️⃣ 动态分析与静态分析结合:加入运行时因素
批评回应:
改进方案:结合动态分析,加入运行时调用、分支预测等数据
3️⃣ 对代码重复和不规则模式的敏感度提升
批评回应:
改进方案:检测代码重复、模板实例化和异常处理的影响
4️⃣ 基 于结构性模式的多元化评分模型
批评回应:
改进方案:引入多元化模型,适应不同代码模式和任务场景
5️⃣ 与其他复杂度指标的结合:形成综合性复杂度模型
批评回应:
改进方案:融合 多种复杂度指标,进行加权组合
综合模型公式:
数据集准备
对比数据集:
本数据集
来源:现有基准测试
来源:开源计算项目 (Computational Science)
实验准备
IR Understanding
Optimization Analysis IR 分析任务(准确性、对 IR 理解是否正确)
Optimized Code Generation IR2IR 生成优化 IR 的任务
静态数据集对比
函数性能对比
0
%
搜索
数据库加载中
复制
百度搜索
转到链接
粘贴
空降评论
复制本文地址
新窗口打开
转到链接
复制链接
保存图片
在新窗口打开
复制图片链接
随便逛逛
昼夜切换
关于博客
美化设置
切换全屏
打印页面