博客
关于我
神奇的文本编辑,惊人的移花接木 | ACM MM 2019 论文赏析
阅读量:574 次
发布时间:2019-03-09

本文共 1874 字,大约阅读时间需要 6 分钟。

ACM Multimedia 2019录用论文《Editing Text in the Wild》主要介绍了一种用于自然场景文本编辑的端到端网络SRNet。该方法能够在保留场景文字风格的同时,替换文字内容并与背景无缝融合,实现视觉逼真效果。

研究背景

自然场景文字编辑是当前研究热点,广泛应用于广告图片编辑、文字纠错、AR翻译等场景。然而,这一任务面临两个主要挑战:场景文字的复杂多样性(包括字体、颜色、大小等差异)以及背景复杂度高(纹理细节丰富,局部不均匀)。现有风格迁移方法难以同时满足文字风格迁移和背景融合的需求。

方法原理

SRNet采用模块化设计,将场景分为前景与背景。网络主要包含三个模块:Text Conversion Module、Background Inpainting Module和Fusion Module。

  • Text Conversion Module:基于Encoder-Decoder结构,负责文字特征迁移,如字体、颜色、形变等信息生成目标文字图像。
  • Background Inpainting Module:擦除风格图片中的文字并修复纹理,生成清晰背景图像。
  • Fusion Module:将转换后的文字与擦除后的背景无缝融合,生成最终结果。
  • 该模块采用跳跃连接传递特征信息,并通过GAN结构辅助生成更真实合理的结果。实验使用合成数据训练,真实场景测试验证效果。

    主要实验结果

    实验结果表明SRNet在英文短词、长词及跨语种翻译、文字擦除等任务中表现优异。通过定量指标如l2 error、PSNR、SSIM和seq_acc评估,验证了方法的有效性。

    总结及讨论

    SRNet成功实现自然场景文本编辑任务,主要包括三个步骤:前景文字风格提取转换、背景文字擦除修复和融合合成。方法在主观视觉真实性和客观定量评分上均表现良好,同时具备文本擦除和跨语言编辑能力。通过ablation study验证了网络设计的有效性。

    参考文献

    [1] Samaneh Azadi, Matthew Fisher, Vladimir Kim, Zhaowen Wang, Eli Shechtman, Trevor Darrell. Multi-content GAN for Few-Shot Font Style Transfer. CVPR, 7564–7573, 2018.[2] Shuai Yang, Jiaying Liu, Wenjing Wang, Zongming Guo. Tet-GAN: Text Effect Transfer via Stylization and Destylization. AAAI, 1238–1245, 2019.[3] Shuai Yang, Jiaying Liu, Wenhan Yang, Zongming Guo. Context-Aware Unsupervised Text Stylization. ACM Multimedia, 1688–1696, 2018.[4] Olaf Ronneberger, Philipp Fischer, Thomas Brox. U-Net: Convolutional Networks for Biomedical Image Segmentation. MICCAI, 234–241, 2015.[5] Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio. Generative Adversarial Nets. NeurIPS, 2672–2680, 2014.[6] Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A Efros. Image-to-Image Translation with Conditional Adversarial Networks. CVPR, 1125–1134, 2017.[7] Shuaitao Zhang, Yuliang Liu, Lianwen Jin, Yaoxiong Huang, Songxuan Lai. EnsNet: Ensconce Text in the Wild. AAAI, 801–808, 2019.

    转载地址:http://agfsz.baihongyu.com/

    你可能感兴趣的文章
    Nginx配置文件nginx.conf中文详解(总结)
    查看>>
    Nginx配置负载均衡到后台网关集群
    查看>>
    ngrok | 内网穿透,支持 HTTPS、国内访问、静态域名
    查看>>
    NHibernate学习[1]
    查看>>
    NHibernate异常:No persister for的解决办法
    查看>>
    NIFI1.21.0_Mysql到Mysql增量CDC同步中_日期类型_以及null数据同步处理补充---大数据之Nifi工作笔记0057
    查看>>
    NIFI1.21.0_NIFI和hadoop蹦了_200G集群磁盘又满了_Jps看不到进程了_Unable to write in /tmp. Aborting----大数据之Nifi工作笔记0052
    查看>>
    NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现数据实时delete同步_实际操作04---大数据之Nifi工作笔记0043
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
    查看>>
    NIFI从MySql中离线读取数据再导入到MySql中_03_来吧用NIFI实现_数据分页获取功能---大数据之Nifi工作笔记0038
    查看>>
    NIFI从PostGresql中离线读取数据再导入到MySql中_带有数据分页获取功能_不带分页不能用_NIFI资料太少了---大数据之Nifi工作笔记0039
    查看>>
    NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
    查看>>
    Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
    查看>>
    NIFI大数据进阶_FlowFile拓扑_对FlowFile内容和属性的修改删除添加_介绍和描述_以及实际操作---大数据之Nifi工作笔记0023
    查看>>
    NIFI大数据进阶_NIFI的模板和组的使用-介绍和实际操作_创建组_嵌套组_模板创建下载_导入---大数据之Nifi工作笔记0022
    查看>>
    NIFI大数据进阶_NIFI监控的强大功能介绍_处理器面板_进程组面板_summary监控_data_provenance事件源---大数据之Nifi工作笔记0025
    查看>>
    NIFI大数据进阶_内嵌ZK模式集群1_搭建过程说明---大数据之Nifi工作笔记0015
    查看>>
    NIFI大数据进阶_外部ZK模式集群1_实际操作搭建NIFI外部ZK模式集群---大数据之Nifi工作笔记0017
    查看>>