ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

PHP – 从不同文件格式中提取文本Word / Excel / Powerpoint / PDF / RTF

2019-06-30 05:19:06  阅读:265  来源: 互联网

标签:php excel ms-word pdf powerpoint


我正在开发一个Web应用程序,用户可以上传不同的文件MS Word(.doc和.docx),Excel(.xls和.xlsx),Power point,PDF,文本文件和Rich Text Files(.rtf).

作为应用程序流程的一部分,我想在IFrame中显示文件内容的预览,HTML最好,但我可以使用PHP类来使用文本

我使用的方法是:

>确定每个文件的扩展名
>以不同方式处理每个文件
>显示文本或HMTL

有没有这样做的图书馆?

更新:

将我的最终解决方案作为答案发布,而不是更新问题

解决方法:

没有单个库可以解决问题所以我使用以下库为每种文件类型解决了它:

a)MS Word文档 – Live Docx(http://www.phplivedocx.org/2009/08/13/convert-docx-doc-rtf-to-html-in-php/)

b)MS Excel – PHP Excel(http://phpexcel.codeplex.com/)

c)来自PDF的文本 – 来自此Pastebin http://pastebin.com/hRviHKp1的类

d)Powerpoint – 仍在进行中

我在我的博客http://ssmusoke.wordpress.com/2012/06/16/display-contents-of-different-file-formats-wordexcelpowerpointpdfrtf-as-html/上提供了更多详细信息

标签:php,excel,ms-word,pdf,powerpoint
来源: https://codeday.me/bug/20190630/1333122.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有