ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

php 使用 phpword 操作 word 读取 word

2019-08-09 14:04:06  阅读:279  来源: 互联网

标签:elements word phpword 获取 result inE php 节点


思路 

1. 加载word文件。
2. 循环判断加载出来的数据。
( 数据下面有很多个节点 )
( 节点是按照数据的类型分类的 例如 无样式的文本是RunText,换行是TextBreak,表格是table.....等)
3. 循环判断他们的数据类型是什么进行读取。
4. 如果是文本的话就使用 节点->getText() 就直接可以获取到文本内容 表格的话有点麻烦。

关于操作word的一些东西
https://segmentfault.com/a/1190000019479817?utm_source=tag-newest
https://www.cnblogs.com/mengluo/p/10280381.html(本博源于这个博客)


代码


// 准备条件 下载 phpword 的拓展库

// 加载
$source     = IOFactory::load($filePath)->getSections();

foreach ($source as $S)
{
            $elements = $S->getElements();
            if (!empty($this->GetElement($elements)))
            {
                $arr = $this->GetElement($elements);
                $this->todoGo($arr,$tableCatId,$tableStageId,$filePath,$versionId);
            }
}

// 逐级读取/读取节点
function GetElement($elements)
{
        $arrx=[];
        foreach ($elements as $k=>$e1)
        {
            // 获取word对象中对应内容类型类的节点的类名
            $class = $this->getClass($e1);
            if ($class=='Table')
            {
                 // 获取最大行
                 $rows=count($e1->getRows());

                 // 获取最大列
                 $cells=$e1->countColumns();

                 $arrx[$k]['rows']=$rows;
                 $arrx[$k]['cells']=$cells;

                 // 循环获取对应行和列下的单元格的文本内容
                 for($i=0;$i<$rows;$i++)
                 {
                      // 获取对应行
                      $rows_a=$e1->getRows()[$i];
                      for($j = 0; $j < $cells; $j++)
                      {
                           // 获取对应列
                           $x=$rows_a->getCells()[$j];
                           $arrx[$k]['text'][$i+1][$j+1]=$this->getTextElement($x);
                      }
                 }
            }
      }    
}    

//获取文本的节点
function getTextElement($E)
{
        $elements = $E->getElements();
        $xas='';
        $result = [];
        $inResult=[];
        $text=[];

        foreach($elements as $inE)
        {
            $ns = get_class($inE);
            $elName = explode('\\', $ns)[3];

            if($elName == 'Text')
            {
                $result[] = $this->textarr($inE);
            }
            elseif (method_exists($inE, 'getElements'))
            {
                $inResult = $this->getTextElement($inE);
            }

            if(!is_null($inResult))
            {
                $result = array_merge($result, $inResult);
            }
        }
        return count($result) > 0 ? $result : null;
}      

//获取文本
function textarr($e)
{
      $textArr['text']=$e->getText();
     return $textArr;
}     

 

 

标签:elements,word,phpword,获取,result,inE,php,节点
来源: https://www.cnblogs.com/lky-19990802/p/11326733.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有