【论文阅读-EMNLP-2019】JuICe代码生成数据集

最新推荐文章于 2022-04-19 17:01:20 发布

土豆洋芋山药蛋

最新推荐文章于 2022-04-19 17:01:20 发布

阅读量430

收藏

点赞数 1

分类专栏：论文阅读【Paper】文章标签：论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_33414271/article/details/115970438

版权

论文阅读【Paper】专栏收录该内容

13 篇文章 3 订阅

订阅专栏

JuICe: A Large Scale Distantly Supervised Dataset for Open Domain Context-based Code Generation

Conference: EMNLP-2019

Rajas Agashe, Srinivasan Iyer and Luke Zettlemoyer
Paul G. Allen School of Computer Science and Engineering, Univ. of Washington, Seattle, WA {rajas, sviyer, lsz}@cs.washington.edu

Github: https://github.com/rajasagashe/juice

论文连接： https://arxiv.org/abs/1910.02216

摘要

使用Jupyter notebook进行交互式开发越来越流行，基于交互式开发的场景中往往也存在代码长依赖的情况。为了生成具有长依赖的代码，这篇文章提出了JuICe数据集。其中包含了150万条数据，3.7K条测试用例。
JuICe可用于两种任务

在代码单元中生成API调用序列
生成整个代码单元中的代码

简介

上图展示了数据集中一个例子。蓝色背景的代码展示了最终的目标代码，前面的代码和注释为输入的上下文信息。d表示距离目标代码的距离。

与其他数据集相对比的结果。这篇文章提出数据集的主要优势是在open domain和large scale。

JuICe的基本统计信息，% Contextual表示使用之前cell中的变量或者方法所占比例；%Multi-cell表示目标代码中至少使用了之前2个cell中的变量或者方法。

上图展示了代码中代码和NL的类型，代码中占比最好的是数据探索类，NL中占比最多的是对代码进行抽象描述的类型。

土豆洋芋山药蛋

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

土豆洋芋山药蛋

CSDN认证博客专家 CSDN认证企业博客

Python领域优质创作者

241: 原创

2053: 周排名

182万+: 总排名

142万+: 访问

: 等级

1万+: 积分

4万+: 粉丝

2236: 获赞

651: 评论

7316: 收藏

写文章

热门文章

一句话+一张图说清楚——银行家算法 164067
滤波反投影重建算法（FBP）实现及应用（matlab） 88697
python两个数值互换（浅析a,b=b,a原理） 76392
Matlab实现图像阈值分割 71016
贯穿时域与频域的方法——傅立叶分析（直观理解+Matlab实现） 68851

分类专栏

最新评论

滤波反投影重建算法（FBP）实现及应用（matlab）
鲶鱼与金枪鱼: 你好能分享一下源文件吗？谢谢 2517948662@qq.com
滤波反投影重建算法（FBP）实现及应用（matlab）
山有一木: 您好，求源文件分享，谢谢。1725163883@qq.com
滤波反投影重建算法（FBP）实现及应用（matlab）
S N: 您好，求源文件分享，谢谢。2457757552@qq.com
滤波反投影重建算法（FBP）实现及应用（matlab）
aolianf: 您好，求源文件分享。448032410@qq.com
滤波反投影重建算法（FBP）实现及应用（matlab）
丨镉: 您好，求源文件分享。谢谢。728149056@qq.com

大家在看

学习信息学竞赛最后拿不到金牌保送银牌强基，是不是就白学了？ 546
Redis学习：Redis持久化、Redis事务
Java | Leetcode Java题解之第500题键盘行 151
C++ -string -常见用法3 1279
C++ | Leetcode C++题解之第500题键盘行 138

最新文章

【TaskMatrix.AI - Visual ChatGPT】连接超大模型和超多API来完成任务
【论文阅读-TPAMI2021】Curriculum Learning(课程学习)综述
【论文阅读-Low-code LLM】使用LLM进行可视化编程

目录

目录

分类专栏

动手学深度学习【Tensorflow2.0版本】 9篇

科研【Research】 3篇

强化学习【RL】 1篇

编译原理笔记 10篇

软件分析【SA】 1篇

数据结构与算法——小白学数据结构 8篇

计算机网络 13篇

手把手TensorFlow 6篇

人工智能【AI】 11篇

数据结构与算法【DS】 17篇

机器学习与算法【ML】 35篇

深度学习【DL】 6篇

Python学习笔记【PY】 3篇

自然语言处理【NLP】 17篇

TensorFlow【TF】 6篇

C++学习笔记【C++】 1篇

软件工程【SE】 5篇

数学建模【MM】 3篇

论文阅读【Paper】 13篇

统计学习方法【SL】 1篇

操作系统【OS】 3篇

计算机网络【CN】 15篇

面试经验 1篇

图像处理 8篇

BUG-Daily 13篇

密码编码学与网络安全 7篇

Android学习 10篇

数据挖掘 1篇

优化算法【OA】 8篇

毕业设计 1篇

编译原理 11篇

LeetCode刷题 18篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

玻璃钢生产厂家玻璃钢蘑菇亭雕塑淄博玻璃钢卡通雕塑庆阳景区玻璃钢雕塑哪家好郾城玻璃钢花盆花器广西玻璃钢雕塑园林宁夏玻璃钢雕塑价格铜陵玻璃钢雕塑定做厂家玉林玻璃钢泡沫雕塑厂家六安玻璃钢雕塑需要多少钱湖北公园水景校园玻璃钢雕塑厂家商场洗手间美陈方案玻璃钢卡通鸡雕塑报价安庆学校玻璃钢雕塑供应商玻璃钢花盆花器哪里找徐汇区玻璃钢雕塑价格玻璃钢雕塑预埋图片晋城玻璃钢仿铜雕塑价格商丘铸造校园玻璃钢雕塑厂家玻璃钢雕塑摆放位置图片随州玻璃钢雕塑摆件厂家山东商场美陈销售公司南昌佛像玻璃钢雕塑多少钱苹果玻璃钢雕塑定制西城区专业的商场美陈商场如何玩转美陈玻璃钢雕塑工艺河北环保玻璃钢雕塑市场长沙玻璃钢雕塑制作厂家皋兰玻璃钢雕塑销售惠州商场美陈香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤司机系学生 315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人？张立群任西安交通大学校长杨倩无缘巴黎奥运 “重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身！外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒投喂者赔24万房客欠租失踪房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫：哈马斯三号人物被杀测试车高速逃费小米：已补缴老人退休金被冒领16年金额超20万

玻璃钢生产厂家 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化