逸翎清晗🌈

发表于 2025-08-28 | 更新于 2025-08-28 | 操作系统命令 | Benchmark | 条评论

发表于 2025-08-28 | 更新于 2025-08-28 | 条评论

title: 后端Pass简介——IntrinsicLowering categories: 编译器 LLVM tags: LLVM Backend date: 2025-07-11 07:28:28 cover: description: swiper_index: IntrinsicLowering 这个 IntrinsicLowering 不是一个典型的优化 Pass，而是在 LLVM 后端生成机器指令前，对 IR 中各种内建（intrinsic）函数调用做“降级”处理——要么展开成一段等价的 LLVM IR 序列，要么替换成对外部库函数（如 memcpy、sqrtf）的调用。所以这个 pass 基本是一个模式匹配的过程（500 行）下面对 IntrinsicLowering::LowerIntrinsicCall 中处理到的每一种 LLVM Intrinsic，按出现顺序逐一说明它们最终是如何“降级”或替换的： 1. 分支预测相关 llvm.expect、llvm.expect_with_probability 直接将 __builtin_expect(exp, c ...

【工作中】RAG4IR

发表于 2025-08-26 | 更新于 2025-08-28 | 论文个人 | 条评论

🦈🦈🦈🦈

ChatGPT-RAGCode

发表于 2025-08-26 | 更新于 2025-08-28 | GPT 问答 | 条评论

08487644916692f6bf48f6ce2fee0f2ec5986590fc25c208044b3ad526a9b58483449f5b037a12e948d89af0a9c253d6a4963c9755d5add9929f8fae18516e4a0cd02490dd5ffa759d6f12857b3cc7de272a776b63d3cd964f2c9e44a989565ec67ffb5f4aedf6896b33ff6a5416664c466a6adc547a863c329e562469158f03bd02f105b69809658fb808e970c758b5172532bf9e0b2cfed617690f078190c3e625ca0b84d8b4dc6eb34af9b0a716fa63e8560c124de9903b5296bbb4c48d143f514400392c76ae2dd57a1f70b98408cdf284a7b60bcd8b5f82c1c57348cb52be24b85335419a5729c193f4d9ec60e2f0fc4234fcf07d7b5 ...

RAG4CodeOpt

发表于 2025-08-26 | 更新于 2025-08-28 | 论文Frontiers | 条评论

【】RAG4Code What to Retrieve for Effective Retrieval-Augmented Code Generation? An Empirical Study and Beyond 摘要：仓库级别的代码生成仍然充满挑战，这主要归因于复杂的代码依赖关系以及大型语言模型（LLMs）在处理长上下文时的局限性。尽管检索增强生成（RAG）框架已被广泛采用，但不同类型检索信息的有效性——包括上下文代码、API 以及相似代码片段——尚缺乏系统性的分析。通过在两个基准上的实证研究，我们发现：上下文代码与潜在的 API 信息能够显著提升 LLM 的表现，而检索到的相似代码片段往往引入噪声，甚至会导致性能下降高达 15%。基于这一初步结果，我们提出 AllianceCoder：一种新颖的上下文整合方法，该方法借助链式思维提示（chain-of-thought prompting）将用户查询分解为若干实现步骤，并通过语义描述匹配的方式检索 API。在 CoderEval 和 RepoExec 上的广泛实验表明，AllianceCoder 达到了最新的最优性能，相较现有方法 ...

未命名

发表于 2025-08-26 | 更新于 2025-08-28 | 条评论

AOBO：A Fast-Switching Online Binary Optimizer on AArch64

发表于 2025-08-25 | 更新于 2025-08-28 | 论文Frontiers | 条评论

【二进制·II】AOBO: A Fast-Switching Online Binary Optimizer on AArch64 🌏元信息：今年<u TACO 第二期</u的原创文章（“New Article, Not an Extension of a Conference Paper.”），来自华东师范大学，不开源。关键词：Post-link optimization, code layout optimization, online code replacement, AArch64 instruction set architecture（后链接优化，代码布局优化，运行时代码替换，AArch64 ISA） TL;DR ：AOBO 是首个面向 AArch64 的在线二进制优化器。它基于 BOLT 重写器，提出低复杂度的混合边权估计方法，并通过在线代码替换在不中断应用的情况下完成优化切换。在 MySQL/MongoDB 等实际场景中实现了显著加速和亚秒级停顿时间。前言这篇论文的方法论整体上比较朴素。由于我对 BOLT 已经较为熟悉，通读全文后会发现，文中所述 ...

Proof Automation with Large Language Models

发表于 2025-08-13 | 更新于 2025-08-28 | 论文Frontiers | 条评论

【杂文·I】Proof Automation with Large Language Models 这是一篇公式化论文，公式就是 LLM+XXX 不断迭代修复，同时说明自己发现的现象，以及如何让 LLM 通过 prompt engineering 的方式提高 XX 率。摘要：诸如 Coq 之类的交互式定理证明器，是在形式上保证软件正确性的强大工具。然而，使用这些工具往往需要大量的人工投入与专业知识。尽管大型语言模型（LLMs）在自动生成自然语言形式的非正式证明方面已展现出潜力，但在生成可直接用于交互式定理证明器的形式化证明时，其表现仍不尽如人意。本文开展了一项形成性研究，以识别 LLM 在生成形式化证明过程中常见的错误。通过分析 GPT-3.5 在 520 个证明生成错误中的表现，我们发现 GPT-3.5 往往能够正确把握证明的高层结构，但在低层细节处理上存在明显不足。基于这一洞察，我们提出了 PALM——一种全新的“生成—修复”方法，该方法首先利用 LLM 生成初始证明，然后借助针对性的符号化方法迭代修复低层次问题。我们在一个包含超过 1 万个定理的大规模数据集上对 PALM 进行 ...

Plankton： Reconciling Binary Code and Debug Information

发表于 2025-08-11 | 更新于 2025-08-28 | 条评论

【二进制·I】Plankton: Reconciling Binary Code and Debug Information 元信息：领域：二进制，反汇编，二进制提升，LLVM IR，栈消歧，类型系统作者单位：香科大，香港城市大学发表：ASPLOS 2024 TL; DR：Plankton 是一种面向二进制的提升器（lifter），能够将编译优化过的二进制精确恢复为接近源代码级别的 LLVM IR，并保留高质量变量、类型和作用域信息。它通过栈区消歧、别名分析以及调试信息利用，有效提升静态分析在反编译 IR 上的准确性和适用性。评测显示，Plankton 在大规模基准和真实项目中显著减少了静态分析的误报与漏报，同时具备可扩展性，可支持更多体系架构与下游 LLVM 应用。简评：这篇论文工作扎实，显然源于作者丰富的实践经验与深入的调研洞察，研究内容横跨多个相关领域，不仅涉及二进制分析，还涵盖编译器、类型系统等编译与程序设计的大类下的多个子领域。具体实现部分均基于严谨的算法设计，细节繁多、技术性强，因此此处未逐一展开。若进行略读，仅需关注第一章，即可快速把握研究动机与一个典型示 ...

💐

发表于 2025-08-02 | 更新于 2025-08-28 | 理论GPT 问答 | 条评论

3c94e1bde83b70c51e4e4a5eaefd2189d9876754ad7b9e6859a652193e78b0ab91c5a30bf837ad74a1c2a28e39770a466e2307cba5995306f5def95f2027b8dcbdbc366464a15a009a9a68052e3bb82f68da921f059ae8cbc9f2188b3affcb91a83cf9924574d83f97611e0932805524d785980e7386292c536e01cfc968cfa379e5107a963ab895d68224f82beec177b15866c1b8119e9e67265924bd04316fe67eb1e82edff315af96fe2007fb26443675cb075a3c5ab9ea950f41c1762acaad3e92bbe9e9dcfc60788d865f7e71533a79b70f37c1997d6453822c7d2a1a4bda6869207f9a14d1305ae5054f0c4fdd99a45cf8cfd76c8b9 ...

💐

发表于 2025-08-01 | 更新于 2025-08-28 | 理论GPT 问答 | 条评论

98eb2d93eaa46b6e84ccf5b83a7b894c367c4d0ec523be21666fd96ad54ef793101d6e77443474eccc30d28e9bfb55ae27ef4d60905d8909d9d1ad8c2c8fe40684604680d02de018491f8c6d4905fdcd81769650ff47cd3ee10cf4ae9ec21660d81a897095717aaff5344871b1aeffb902a755f0833b34640790af966faf57bc98f35de0df2fe2afcfe21c72694102e5883ea48e6b913a54176d2e5ae58475bec5e7bdafaec05dd2e412d2d6df2a4192804077251789130c7e24520d8a6abfd9a0bf7173aeae4a9ef81cc3bd83439cbff6f6825cfb1e53da146792da68ad88b1328c0934aaed8a3408606ac1f87721f803662923a5fd63c17 ...

Language Models for Code Optimization： Survey, Challenges and Future Directions

发表于 2025-07-24 | 更新于 2025-08-28 | 论文Surveys | 条评论

【综述解析·V】Language Models for Code Optimization: Survey, Challenges and Future Directions (推荐) 个人领域内强相关的综述（LMs，ML，Code Optimization，Compiler Optimization，Systems），链接🔗 元信息：来源：Arxiv2025.01 的论文，感觉目标投稿为 CSUR，看样子已经投稿完毕了，但是 CSUR 审稿期很长，所以暂时还未到正刊。作者：利兹大学 & TurinTech AI 利兹大学教授 Wang Zheng（王峥）算是领域内比较有名的人物之一了，至少在 AI for Compiler 和其他领域上从事十余年之久，他的很多论文和合著论文都是在领域内具有广泛影响力的，比较著名的就是一篇发在 CCF-A（Proceedings of the IEEE）的特邀论文 Machine Learning in Compiler Optimisation，他的合作单位广泛，Meta AI、爱丁堡大学较为出众，也和计算所编译的大团队有论文交 ...