QuIP方法量化方法的中的不相关性

QuIP量化方法中,有一个概念是不相关性的引入。 对于一个现成的模型参数,重新量化是将神经网络中的权重矩阵从高精度表示(如32位浮点数)转换为低精度表示(如2位或4位整数)的过程。这个过程可以显著减小模型的存储需求和计算复杂度,从而提高模型的运行效率。然而,量化过程可能会导致模型性能下降,因为低精度表示可能无法完全捕捉原始权重矩阵的信息。 QuIP方法通过引入权重矩阵和Hessian矩阵之间的不相关性来解决这个问题。不相关性意味着这两个矩阵的元素在不同坐标轴上的变化程度较小。在量化过程中,这种不相关性有助于确保量化后的权重矩阵能够更好地逼近原始权重矩阵,从而减小量化误差。 为了实现这种不相关性,QuIP方法在自适应四舍五入过程的预处理和后处理阶段使用了随机正交矩阵的Kronecker积。这种方法可以在不显著增加计算复杂度的情况下实现矩阵的不相关性,从而提高量化过程中的准确性。。 这里的不相关性,在含义上有些模糊,它实际的作用其实是将原权重矩阵扩展到了更多的不同坐标轴上的变化。 直观一点来说 ,例如在三维空间中,正交矩阵可以打比方是一个在三维坐标轴里歪着摆放的立方体,而正交矩阵可以通过对角化变成一个摆正的立方体,而这种摆正通过正交矩阵自己就可以实现,只要与自己的逆矩阵相乘即可,因为本质上正交矩阵在任意的坐标轴下它都是相互正交(垂直)的。 以三维空间为例,乘以一个三维的正交矩阵,相当于让它在三维空间中进行了旋转,而要旋转回来,只要知道乘的是什么矩阵,那么乘以它的逆矩阵。 一个三维向量乘以一个Kronecker积矩阵(A ⊗ B)相当于在原始三维空间中进行旋转和缩放,然后在这个旋转和缩放后的空间中再次进行旋转,这个过程比喻得不是非常恰当,只能说感性理解,总之,根本还是看作是对向量在两个正交空间中进行了一系列变换。 因此可以理解,由于正交性意味着随机正交矩阵的列向量是两两正交(垂直)且单位长度的,因此将一个矩阵(如权重矩阵或Hessian矩阵)与随机正交矩阵进行Kronecker积运算时,这些正交列向量会作用于原始矩阵的行和列,从而在新生成的矩阵中产生一组新的正交基,这组新的正交基可以使得新矩阵在不同坐标轴上的分布更加均匀。 另外还有一个重要因素,就是引入了随机性,随机正交矩阵的元素是随机生成的,这种随机性有助于打破原始矩阵之间的相关性,使得新生成的矩阵在不同坐标轴上的分布更加分散,这种分散性有助于实现矩阵之间的不相关性,从而提高量化过程中的准确性。 简单来说就是,产生一个随机的正交矩阵,然后将原权重与该正交矩阵进行Kronecker积运算,由于Kronecker积运算并不会改变原始矩阵的秩,新生成的矩阵仍然保留了原始矩阵的大部分信息。 如果从图像的角度来说,Kronecker积可当相当于对原始图像的每一个像素进行了扩展,如果是乘以单位矩阵,效果那么就类似于图像的缩放,而现在乘的是正交矩阵,则相当于对每一个像素进行了“多轴不变”的扩展操作。

Read More

Layer Norm 与 RMS Norm 的区别

Norm即Normalization,是对数据进行归一化的一种操作,一般是将数据归一化到“平均为0,方差为1”的分布中,RMS Norm相比Layer Norm少了一个除以平均数的步骤。 Layer Norm即是直接对层进行正则化,一般有两种,一个是事先正则化(pre norm),一个是事后正则化(post norm)。 事先正则化就是直接对于输入进行正则化,然后再计算结果,事后正则化则是结果计算出来后,再统一进行正则化。 虽然网上有一些资料指出,Post Norm效果要比Pre Norm好,但实际上,目前流行的网络模型中,如模型里,LLaMA、BLOOM用的都是Pre Layer Norm,而ChatGLM用的是Post Deep Norm。 进一步的在LLAMA2中,则进一步改用了RMSNorm,不但效果不错,更重要的是进一步提高了计算效率。

Read More

从ChatGPT的文字总结能力联想到一点小思路

用幽默而直白的方式介绍DND中的各类种族: 矮人族:一群铁匠和酒鬼的混合体,他们觉得生命的意义就是打铁、喝酒,还有争论哪种泡沫更好:啤酒泡沫还是洗澡泡沫。 兽人族:一堆大块头,见解通常是“如果不明白,就用力打”。他们曾试图开办餐馆,但因为每道菜的烹饪步骤都是“砸、炸、煮、烤”,最后只好转行当了破墙专家。 侏儒族:他们发明了各种诡异的机器,但常常会出现奇怪的故障。一次,一个自动切洋葱的机器突然变成了时间机器,把整个族群送回了侏罗纪时代。 人类:他们总是追求无止境的“新”和“刺激”,不知疲倦地探索未知领域,包括睡觉前用手机“社交”和花费数小时在猫视频上。 半身人:短个子们经常为了争夺顶架上的面包而展开激烈的战斗,有时会拉出小小的斗牛场,赌注是谁能在比赛结束前,先爬到面包顶端。 狐族:他们总是在讲冷笑话,即使没有人笑,他们也会继续。为了安慰别人,他们还会加上一句:“开玩笑的,我可不是个‘狐’人!” 巨人族:身材高大的他们,经常因为低矮的门框而磕磕碰碰。不过,这还不及他们在每年的“巨人踩蚊子比赛”中,给蚊子们带来的短暂幸福。 妖精族:他们总是调皮捣蛋,有一次,他们用魔法把一个骑士的盔甲变成了泳衣,结果骑士去救公主时,竟然变成了“裸奔骑士”。 精灵族:生活在森林深处的神秘种族,拥有优雅的外表和灵巧的身手。他们与自然息息相关,常常与动植物进行心灵交流。精灵们崇尚和谐、平衡,对环境的保护有着深刻的意识。以下是对精灵族的一些幽默但直白的描写: 精灵族:生活在森林中,皮肤若隐若现,好像他们一直在玩"你看不到我"的游戏。他们的耳朵像是在练耳朵俯卧撑,总是昂起,警惕地捕捉每一个声音。 高等精灵:傲慢得像是风中的柳絮,总是以一副“我不屑和你争论”的表情来参与各种争论。他们的笑容好像是一种精细的魔法,只有你乖乖听话,他们才会用。 森林精灵:他们的头发常常被小动物编成各种花样,好像一个移动的花园。他们热衷于自然界的和谐,但有时会在植物之间藏一只派对举办地,大家欢迎入场。 水精灵:总是身边带着一瓶水,仿佛随时随地都准备着“万一有紧急需求”。在他们的家中,洗澡时间是圣洁的仪式,而且很有可能会持续好几小时。 火精灵:他们生活在火山附近,总是闪闪发光,火苗好像在向他们致敬。虽然爱好火焰艺术,但请不要在他们面前扔火柴,那是对他们的不敬。 冰精灵:他们的家常常是一个巨大的冰雕城堡,里面充满了美丽的冰雕和华丽的冰雕灯。当你走进去时,别忘了穿上厚厚的外套,因为温度更低。 夜精灵:他们只在夜晚活动,像是夜里的行走艺术家。虽然看似阴沉,但他们对于星座和夜空的知识,却能让你感叹:“哦,原来北极星的名字是...” 采用同样的风格描述克苏鲁: 克苏鲁 (Cthulhu):就像是一个庞大的、绿色的泡泡,但有一颗满是恶作剧的心。他一会儿睡在海底,一会儿又想要出来捣乱。听说有次他冒出来时,被当成是一个夜光贴纸,结果吓坏了不少船长。 尤古-索托斯 (Yog-Sothoth):这家伙就像是个活生生的百科全书,什么事都知道,但他会以你不理解的方式回答。你问他今天天气怎么样,他可能会告诉你在18世纪某个星期四的天气。 亚苏托斯 (Azathoth):可以把他想象成一个宇宙级的嬉皮士,他坐在那里,弹着火星吉他,用恶搞的方式创造宇宙。但小心,如果他停下来,宇宙可能就会崩溃。 纳克托 (Nyarlathotep):他是克苏鲁神话中的万能小助手,总是变着样子,有时候是帅气的陌生人,有时候是毛茸茸的猫,但你永远不知道他到底是在搞什么鬼。 阿兹托尔斯 (Azathor):看起来像个飞天的变态乌鸦,他是时间和空间的守护者,不过在他的管理下,时间经常玩失踪,所以别指望他会按时叫你起床。 戈祖尔 (Ghoul):克苏鲁的食人族朋友,他们喜欢吃肉,尤其是人类。听说有一次,他们搞了一场意外的“夜宵聚会”,结果吓得附近的人都失眠了好几个月。…

Read More

人工智能时代可能会兴旺的职业

科技与信息技术行业 人工智能模型评估师 负责对人工智能生成的模型进行评估和测试,检测其性能和效果,提供模型优化和改进的建议。 AI模型监督员 负责对人工智能生成的模型进行监督和管理,确保其在应用过程中遵循道德、法律和社会准则,防止不当行为和偏差。 数据集清洗师 负责对用于训练人工智能生成模型的数据集进行清洗和处理,确保数据集的质量和准确性,优化模型的训练效果。 人工智能生成内容编辑师 负责对由人工智能生成的内容进行编辑和校对,确保其质量、准确性和合规性。 创意与设计行业 创意导演 负责与人工智能生成模型合作,引导其生成符合创意要求的作品,包括广告、电影、音乐等创意内容的生成和编辑。 创意审核员 负责对人工智能生成的创意内容进行审核和评估,确保其符合品牌形象、道德规范和法律法规。 艺术家/设计师 与人工智能生成模型合作,利用其生成的作品作为创作灵感或素材,进行艺术创作或设计工作。 市场营销与广告行业 人工智能广告优化师 负责利用人工智能生成模型对广告进行优化和改进,包括广告文案、图像和投放策略的生成和优化。 广告创意策划师 与人工智能生成模型合作,引导其生成创意广告内容,包括广告文案、图像和视频的生成和编辑。 数字营销策略师 负责利用人工智能生成模型进行市场数据分析和用户行为预测,为数字营销战略提供决策支持和优化建议。 教育与培训行业 教育内容生成师 与人工智能生成模型合作,引导其生成教育课程、培训资料等内容,为在线教育和培训提供优质的教学资源。 在线课程设计师 负责利用人工智能生成模型生成在线课程的教学大纲、教材、作业和评估,设计和优化在线学习体验,提供个性化和智能化的教学方案。 人工智能教育顾问 负责根据人工智能生成模型的应用,为教育机构和教师提供咨询和指导,帮助其合理应用人工智能技术,提升教学质量和效果。…

Read More