源码解读系列之GAIN模型

23 篇文章 7 订阅
订阅专栏

前言

  • 论文题目《Double Graph Based Reasoning for Document-level Relation Extraction》
  • 论文 地址
  • 文章来源:CSDN@LawsonAbs
  • 推荐指数:★☆☆☆☆

首先声明一下,下面这篇文章写得不是很系统,如果需要高质量的博客进行介绍,请文末留言,我再更新。
mention_id 描述的是一篇doc 被tokenizer 之后,得到各个位置下的token对应哪个mention的下标?如果不对应mention,则置为0.
mention_id 的size 是[batch_size,max_length]
在这里插入图片描述

mentions
size = [mention_num,max_len]
在这里插入图片描述

其实可以发现: mentions 中每行的值相同,都是 mention_id[i] 的值

mention_index
在这里插入图片描述
当前这篇doc有多少个mention,那么mention_index 的size(0) 就是多大。mention.size(1) = max_length

其中的值如下:
在这里插入图片描述
这个mention_index 后面会用到(与mentions做比较操作),第i行负责提取出第i+1(因为mention从1开始计数,但是下标从0开始计数)个mention的表示。

再看 select_metrix
这个select_metrix 就是由 mention_index 和 mentions 比较得到,其计算过程如下:
select_metrix = (mention_index == mentions).float()
在这里插入图片描述
得到的计算结果就是 select_metrix[0]

在这里插入图片描述

上面这个红框的含义就是:这两个位置的表示就是第0+1个mention 的位置。

torch.sum(select_metrix, dim = -1)
表示的就是对 select_metrix 这个矩阵每行求和,得到的值如下:
在这里插入图片描述
这个值的含义就是:找出这篇doc中有几个token表示这个mention。

torch.sum(select_metrix, dim=-1).unsqueeze(-1).expand(-1, slen)
再做一个unsqueeze(-1) 以及 .expand(-1,slen) 操作,就是将每行的值复制一份,扩展到每列上。值如下:
在这里插入图片描述

接着对 select_metrix 做一个赋值
select_metrix = torch.where(word_total_numbers > 0, select_metrix / word_total_numbers, select_metrix)
这个代码的含义就是想 计算每个token在整体doc中的权重:
在这里插入图片描述
最后便得到mention的表示。
x = torch.mm(select_metrix, encoder_output) # [mention_num, bert_hid]

接着来看根据mention 取 entity 表示的过程

在这里插入图片描述

这个值是怎么获取的?
在这里插入图片描述
这个变量有什么特征?
可以观察到: entity2mention_table[i].size(0) <= entity2mention_table[i].size(1) , 这个是恒成立的。因为第一维代表的是entity num,第二维代表的是mention num。 实体数是要大于mention 数的。
在这里插入图片描述
这里的 entity num 和 mention num 都是从0开始计数,单纯的表示doc中的第几个实体。

mention_nums 表示的是将每列的值扩充到多列
在这里插入图片描述

select_metrix = torch.where(mention_nums > 0, select_metrix / mention_nums, select_metrix)
这行代码的作用同上面的做法相同,(之前的是在token上找出mention的,这就是在 mention 上找出 entity 的)

得到的值如下:
在这里插入图片描述

查看模型生成正负样本的逻辑

首先了解一下这各个变量
relation_multi_label
这个是什么意思?

realtion_label
在这里插入图片描述
代表的含义就是:当前batch中各个doc拥有的标签数。[batch_size,label_num]

relation_mask
因为有的doc没有那么多label,所以需要一个mask操作。
在这里插入图片描述

在这里插入图片描述

Bug 排查

在这里插入图片描述
发现图卷积之后的结果很多都是0?这是怎么回事儿?

查看有边的节点:
在这里插入图片描述
其中a表示的是有边的节点。可以发现:上面结果为0的那些节点都是没有边的。所以导致出现了问题。

最后参与分类的特征多,loss 下降的确实更加明显,比较的是下面两个部分:

predictions = self.predict(torch.cat(
(h_entity, t_entity,global_info),dim=-1)
)

在这里插入图片描述

predictions = self.predict(torch.cat(
(h_entity, t_entity,torch.abs(h_entity - t_entity), torch.mul(h_entity, t_entity),global_info),dim=-1)
)

在这里插入图片描述

我当前的这种思想:
使用train.json建立一个全局的graph,这可能导致数据泄漏,因为在训练前我们就把标签数据写到图中了,这样就导致模型可以直接读取了。所以存在一定的问题。

当我仅仅以 train.json 创建graph_big 时,训练10 epoch 之后,在dev.json 上验证,效果就仅有
在这里插入图片描述
这性能是远远不够的!

GAN(Generative Adversarial Network,GAN)模型之:SeqGAN、IRGAN、StackGAN、BigBiGAN、GAIN模型
data+scenario+science+insight
06-03 356
GAN(Generative Adversarial Network,GAN)模型之:SeqGAN、IRGAN、StackGAN、BigBiGAN、GAIN模型 目录 GAN(Generative Adversarial Network,GAN)模型之:SeqGAN、IRGAN、StackGAN、BigBiGAN、GAIN模型 SeqGAN IRGAN StackGAN BigBiGAN GAIN SeqGAN 标准的GAN在处理像序列这种离散数据时会遇到的困难,主要体现在两个..
yolov8源码解读(part2: 检测,分割)
蓝羽飞鸟的博客
07-04 1349
检测,分割,NMS
Meta-GAIN:扩展GAIN模型以弥补缺失的数据插补
02-20
元增益 GAIN模型的扩展,用于缺少数据插补。 其中一些代码来自切尔西·芬恩(Chelsea Finn)的MAML实现( ),她的CS330斯坦福课程( )和Jinsung Yoon的GAIN实现( )。
GAIN 开源项目实战指南
最新发布
gitblog_00013的博客
08-18 377
GAIN 开源项目实战指南 GAIN项目地址:https://gitcode.com/gh_mirrors/gain1/GAIN 项目介绍 GAIN,一个由DreamInvoker发起并维护的开源项目,旨在通过创新的解决方案,解决数据增强和图像处理中的常见挑战。该项目利用先进的算法技术,实现对图像数据的智能增强,从而提升机器学习模型的训练效果。GAIN不仅优化了数据不平衡的问题,还大大丰富了训练...
探索文档级关系提取新境界:双图推理模型GAIN
gitblog_00074的博客
06-15 930
探索文档级关系提取新境界:双图推理模型GAIN GAIN项目地址:https://gitcode.com/gh_mirrors/gain1/GAIN 在自然语言处理的广阔天地中,文档级关系抽取(Document-level Relation Extraction)是一块充满挑战的领域,它要求模型能够跨越多个句子,理解实体间的复杂联系。今天,我们向您隆重介绍一个前沿的开源项目——基于双图推理的文档...
GAIN:生成对抗式插补网络(GAIN)的代码库-ICML 2018
05-23
“生成对抗式插补网络(GAIN)”的代码库 作者:尹振成,詹姆斯·乔登,米哈埃拉·范德沙尔 论文:Jinsung Yoon,James Jordon,Mihaela van der Schaar,“ GAIN:使用生成对抗网络进行数据插补”,国际机器学习会议(ICML),2018年。 论文链接: : 联络人: 该目录包含使用两个UCI数据集进行插补的GAIN框架的实现。 UCI信( ) UCI垃圾邮件( ) 要运行有关GAIN框架的培训和评估管道,只需运行python3 -m main_letter_spam.py。 请注意,任何模型体系结构都可以用作生成器和鉴别器模型,例如多层感知器或CNN。 命令输入: data_name:字母或垃圾邮件 miss_rate:缺少组件的概率 batch_size:批量大小 hint_rate:提示率 alpha:超参数 迭代:
分类模型的评价指标--混淆矩阵,ROC,AUC,KS,Lift,Gain
热门推荐
shy19890510的博客
03-09 4万+
对于分类模型,常用的指标有混淆矩阵、ROC曲线,AUC值,KS曲线以及KS值、Lift图,Gain图等,查阅了很多的资料,加入自己的理解整理了一下他们的计算方法和意义,希望对大家有帮助。1. 混淆矩阵---确定截断点后,评价学习器性能假设训练之初以及预测后,一个样本是正例还是反例是已经确定的,这个时候,样本应该有两个类别值,一个是真实的0/1,一个是预测的0/1 ...
sklearn.ensemble之RandomForestClassifier源码解读(一)
赫夫曼树的博客
09-27 3292
class RandomForestClassifier(ForestClassifier) A random forest classifier. A random forest is a meta estimator that fits a number of decision tree classifiers on various sub-samples of...
YOLOv5源码逐行超详细注释与解读(2)——推理部分detect.py
路人贾的博客
03-07 4万+
全网最详细的YOLOv5之推理部分detect.py源码逐行注释,近四万字的超详细讲解!小白入门必看!
ID3算法决策树源码解读与实践
此外,源码中可能还包含了数据预处理、决策树剪枝等步骤,这些都是构建有效决策树模型的重要环节。 源码文件名列表中的“id3_ID3算法决策树_源码.zip”仅给出了一个文件名,没有列出文件内部的结构或包含的文件。...
ICML2018论文GAIN补充材料
11-28
此论文是GAIN:Missing Data Imputation using Generative Adversarial Nets 的 Supplementary Materials,里面包括论文公式推导以及代码参数设置
YOLOv5源码逐行超详细注释与解读(6)——网络结构(1)yolo.py
路人贾的博客
03-28 1万+
全网最详细的YOLOv5源码解读之网络结果yolo.py。全文4万字带你逐行注释,逐段讲解,小白也能看懂!
Gains
lzlstyle的专栏
12-02 470
1. Schedule before work.2. Sorry is ineffective but do a good job.3. Prevent higher than remedial
GAIN的代码实现(1)——基于GAN的MNIST数据集图像缺失数据填补
Wendy的博客
05-27 1572
目录一、环境搭建二、GAIN架构2.1 生成器G2.2 判别器D三、其他结构3.1 掩模向量M3.2 其他函数3.3 参数初始化设置3.4 开始训练四、结果演示五、完整代码 本文以MNIST数据集为例,演示利用GAIN对图像缺失数据进行填补的代码实现。 一、环境搭建 Python环境使用的是Python3.7,Tensorflow1.15.0和PyTorch1.11.0。 二、GAIN架构 2.1 生成器G 首先定义生成器,生成器代码如下: class G(torch.nn.Module): def
R语言使用yardstick包的gain_curve函数评估多分类(Multiclass)模型的性能、查看模型在多分类每个分类上的增益(gain)曲线(gain curve)
data+scenario+science+insight
08-04 277
R语言使用yardstick包的gain_curve函数评估多分类(Multiclass)模型的性能、查看模型在多分类每个分类上的增益(gain)曲线(gain curve)
EMNLP2020文档级关系抽取模型GAIN 论文Double Graph Based Reasoning for Document-level Relation Extraction
CycloneKid的博客
11-13 1929
前言 这是EMNLP2020一篇文档级关系抽取的论文,代码链接 https://github.com/DreamInvoker/GAIN,其性能相较ACL2020中的文档级关系抽取模型LSR有一定的提升,其能够有提升的主要原因在于两点:1)构建了异质图并使用了R-GCN进行特征传播,相较之前一些构建同质图然后做特征传播的模型,使用异质图可以融合更复杂的特征;2)增加了关系推理层,构建了一个实体图做关系推理。 1.摘要 文档级关系抽取的目的是提取文档中实体之间的关系。不同于句子层次的关系抽取,文档需要对文档中
GAIN来补充缺失数据之代码篇(一)
YUxuaN0721的博客
07-22 2912
原论文 原代码 在这篇博客中,我们解析用生成对抗系统如何有效补充缺失数据的一种方法。 def gain (data_x, gain_parameters): # Define mask matrix data_m = 1-np.isnan(data_x) #mask matrix # system parameters batch_size = gain_parameters['batch_size'] hint_rate = gain_parameters['hint_rate']
分类模型的性能评估——Lift和Gain
BI&DW Home
10-27 1万+
跟ROC类似,Lift(提升)和Gain(增益)也一样能简单地从以前的Confusion Matrix以及Sensitivity、Specificity等信息中推导而来,也有跟一个baseline model的比较,然后也是很容易画出来,很容易解释。以下先修知识,包括所需的数据集: 分类模型的性能评估——混淆矩阵 分类模型的性能评估——ROC和AUC 一些准备 说,混淆矩阵(Confusion Matrix)是我们永远值得信赖的朋友:                    
GAIN的代码实现(2)——基于GAN的Spam数据集缺失数据填补
Wendy的博客
06-02 1219
本文介绍基于生成对抗网络的Spambase DataSet数据集缺失数据填补源码实现。 “spambase.data”的最后一列表示该电子邮件是否被视为垃圾邮件(1)或非垃圾邮件(0),即未经请求的商业电子邮件。大多数属性表示电子邮件中是否经常出现特定的单词或字符。游程长度属性(55-57)测量连续大写字母序列的长度。...
写文章

热门文章

  • Mysql报错Operand should contain 1 column(s) 241068
  • Java中Math.pow()的用法 115120
  • Linux 命令之软连接详解 110228
  • Windows 无法访问指定设备,路径或文件。你可能没有合适的权限访问这个项目。 73563
  • MySQL 获取当前时间戳 63526

分类专栏

  • 面经 6篇
  • 经典论文 23篇
  • OJ题解 225篇
  • LeetCode 215篇
  • PAT 133篇
  • 络谷 42篇
  • Algorithm
  • dp 23篇
  • EOJ 5篇
  • DFS 11篇
  • Graph Therory 12篇
  • 高精度运算 2篇
  • 排序 5篇
  • Number Theory 3篇
  • 字符串 2篇
  • other 7篇
  • 数据结构 17篇
  • matplotlib 1篇
  • NLP 86篇
  • Hanlp 1篇
  • ML 44篇
  • pytorch 53篇
  • 推荐系统 3篇
  • TensorFlow 1篇
  • 设计模式 19篇
  • 读书笔记 1篇
  • 《深入浅出图神经网络》 1篇
  • 《Shell脚本攻略》 8篇
  • 《Java多线程编程核心技术》 5篇
  • 《scala cookBook》 4篇
  • 《Hadoop权威指南》 9篇
  • 《Data Algorithms》 10篇
  • 《深度学习框架PyTorch-入门与实践》 读书笔记 1篇
  • 《神经网络与深度学习》 2篇
  • 编程语言
  • Java 141篇
  • python 35篇
  • C/C++ 54篇
  • Scala 35篇
  • C# 4篇
  • openTSDB实战 28篇
  • numpy 1篇
  • Big Data 1篇
  • Spark 26篇
  • Hadoop 52篇
  • Hive 7篇
  • HBase 19篇
  • Kafka 7篇
  • zookeeper 2篇
  • Linux 139篇
  • 开发工具 35篇
  • Git 13篇
  • JDK源码解读 17篇
  • openTSDB文档翻译 28篇
  • Mysql 122篇
  • openTSDB源码解析 12篇
  • Azkaban 8篇
  • JSP+Servlet 5篇
  • Front-End 7篇
  • kettle 8篇
  • Computer 12篇

最新评论

  • 使用latex做三线表

    哈哈好: 我这个数据集比较多,超出页面限制怎么办

  • Linux 命令之软连接详解

    努力成为一个硅农中: 创建软链接只能去目标目录下创建吗?目标文件可不可以带路径?

  • 【LeetCode】33.搜索旋转排序数组

    说文科技: 这道题需要注意的是:要对mid做+1 或者-1 的操作,否则会有死循环的风险,但是要做+1/-1 的操作前提就是要判断nums[mid] 是否与target值相等。如果相等就直接返回,如果不等,就更新左右值。

  • 使用scanf输入string类型变量

    说文科技: 这个我还真不知道,对C++不熟悉~

  • 判断母串是否包含子串的某种排列

    CSDN-Ada助手: 推荐 Python入门 技能树:https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

  • Django学习-关系映射
  • 使用OpenSSl库实现AES-GCM-128算法(C语言)
  • WebRTC信令服务与集成
  • 基于SSM品牌银饰售卖系统的设计
  • Verilog问题解决[Modulesim] No drivers or ports for clock 23

最新文章

  • 【LeetCode】123.买卖股票的最佳时间
  • 【LeetCode】228.汇总区间
  • 【LeetCode】190.颠倒二进制位
2024
10月 4篇
09月 6篇
08月 12篇
07月 25篇
06月 21篇
05月 9篇
04月 3篇
2023年14篇
2022年204篇
2021年133篇
2020年162篇
2019年174篇
2018年624篇
2017年57篇
2016年67篇

目录

目录

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

说文科技

看书人不妨赏个酒钱?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家商场美陈鲜花图片浦口百货商场美陈毕节玻璃钢雕塑定制爱情玻璃钢人物雕塑玻璃钢广场人物雕塑定做安阳标识校园玻璃钢雕塑合肥景观玻璃钢雕塑销售厂家福建大型商场美陈生产公司商场产品美陈阜阳步行街玻璃钢雕塑优势韶关商场玻璃钢动物雕塑池州创意玻璃钢雕塑市场玻璃钢大蒜雕塑价格吉安公园玻璃钢雕塑定做价格大型玻璃钢雕塑企业排名海南玻璃钢雕塑在哪有池州佛像玻璃钢雕塑销售厂家信阳玻璃钢动物雕塑价位绍兴玻璃钢花盆供货商深圳泡沫玻璃钢雕塑设计制作汕头党建文化玻璃钢卡通雕塑资阳玻璃钢蔬菜雕塑厂家建安玻璃钢雕塑费用玻璃钢雕塑马设计报价常熟商场美陈装饰金昌广场玻璃钢雕塑安装室外玻璃钢雕塑厂家询问报价盐城玻璃钢仿铜雕塑厂家湖北玻璃钢人物雕塑定制玻璃钢仿铜雕塑安装香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化