使用xml生成word的基本步骤在必威手机官网,1分钟

思路:

1分钟快速生成用于网页内容提取的xslt,具体内容如下

Xml生成word总结

   使用xml生成word的基本步骤在《使用xslt转化xml数据形成word文档导出.doc》中说明比较清楚了。但是其中的细节并未说到,因此自己折腾了两天总算成功了。以下是我在使用过程中碰到的问题要点:

 

当用GOOGLE查的时候,内容几乎都是一样的。但是你想要的东西,一个也没有。例如,我就找不到中国人写的如何使用PYTHON来创建一个XML文件。当然,直接用文件写的方式也能够达到同样的效果,但是毕竟容易出错,而且看起来不优雅。最后,我看了很多资料,终于明白如何使用PYTHON写一个XML文件了。以下就是一个简单的例子,这个例子是已经调试通过的,大家可以放心使用。

1.使用xslt样式,这样可以很好的和xml结合,做出漂亮的报告

1、项目背景

必须使用word 2003.

1.下面通过例子演示:

必威手机官网 1

必威手机官网 2

 

简单 的xml以及对应的xml框架

 

2.分别创建03版本的word文档log_03.doc和o7版本的word文档log_07.docx,并都应用以上生成的log.xsd框架

必威手机官网 3

 

分别另存为log_03_doc.xml,log_07_doc.xml。

3. 用log_03_doc.xml,log_07_doc.xml生成xslt文件log_03.xslt和log_07.xslt。

必威手机官网 4

 

log_03_doc.xml生成log_03.xslt时会弹出以上对话框,仅仅选中xml中指定的namespace就可以了。

 必威手机官网 5

 

log_07_doc.xml生成log_07.xslt时会弹出以上对话框,就是没有xml中指定的namespace,所有无论怎么选,生成的xslt都不是我们想要的。

复制代码 代码如下:

2.生成xml结构

在《Python即时网络爬虫项目说明》一文我们说过要做一个通用的网络爬虫,而且能节省程序员大半的时间,而焦点问题就是提取器使用的抓取规则需要快速生成。在python使用xslt提取网页数据一文,我们已经看到这个提取规则是xslt程序,在示例程序中,直接把一长段xslt赋值给变量,但是没有讲这一段xslt是怎么来的。

不要选其他namespace

必威手机官网 6

log_03_doc.xml生成log_03.xslt时会弹出以上对话框,不要随便再选其他namespace。 生成的xslt截图

 

 必威手机官网 7

 

必威手机官网 8

如果再选中其他namespace,生成的xslt也不是我们要的。生成xslt截图

必威手机官网 9

显然跟上面的不一样。

 必威手机官网 10

 

 必威手机官网 11

 

 

 

import xml.dom.minidom
from xml.dom.DOMImplementation import implementation
import xml.sax.writer
import xml.utils

 

网友必然会质疑:这个xslt这么长,编写不是要花很长时间?

插入图片

要实现插入图片,需要修改log_03.doc.

必威手机官网 12

重新生成log_03.xslt,并修改<ns0:image>节点。

1、删除整个v:shapetype 节点

2、删除  <w:binData节点中的数据,并添加<xsl:value-ofselect="."/>

必威手机官网 13

修改之后

必威手机官网 14

3、修改v:shape 节点,去掉 style 属性,增加xsl 节点,如下:

必威手机官网 15

必威手机官网 16

 

4、去掉w:pict 节点后面的带<xsl:value-ofselect="."/>的所有节点

例子中去掉了如下代码:

<w:r>

         <w:t>

           <xsl:value-of select="." />

         </w:t>

  </w:r>

如果没做第四步,则在word中会出现图片的二进制代码。

 

 

例子:

  QDomDocumentdom;

    QDomProcessingInstructionproc =

       dom.createProcessingInstruction(

       "xml",

       "version="1.0"standalone="no""

       );

    dom.appendChild(proc);

 

    QDomElementr =dom.createElement("log");

    dom.appendChild(r);

    r.setAttribute("xmlns","logs");

    QDomElementuserNode =dom.createElement("user");

    r.appendChild(userNode);

    QDomTextuserTextNode =dom.createTextNode("john");

    userNode.appendChild(userTextNode);

 

    QDomElementloginNode =dom.createElement("login");

    r.appendChild(loginNode);

    QDomTextloginTextNode =dom.createTextNode("2015-01-1811:10:12");

    loginNode.appendChild(loginTextNode);

 

    QDomElementlogoffNode =dom.createElement("logoff");

    r.appendChild(logoffNode);

    QDomTextlogoffTextNode =dom.createTextNode("2015-01-1813:10:12");

    logoffNode.appendChild(logoffTextNode);

 

    QDomElementimageNode =dom.createElement("image");

    r.appendChild(imageNode);

    QStringpng;

    FILE*fpng =fopen("2.jpg","rb");

    if( fpng )

    {

       encode(fpng,png,0 );

       fclose(fpng );

    }

    imageNode.setAttribute("style","width:300pt;height:300pt" );

    charszBuffer[256];

    //sprintf(szBuffer,"wordml://5.png");

    imageNode.setAttribute("key","2.jpg" );

    QDomTextlogonNodeTextNode =dom.createTextNode(png);

    imageNode.appendChild(logonNodeTextNode);

 

 

 

    QStringxml =dom.toString();

    QFilefile("log.xml");

    if(file.open(QIODevice::WriteOnly))

    {

       QTextStreamoutput( &file);

       output.setCodec(QTextCodec::codecForName("UTF-8"));

       //QStringcontent = dom.toString();

       output<< xml;

       file.close();

    }

 

 

    QStringsrc ="msxsl.exe";

    QStringsrc1 ="log.xml";

    QStringsrc2 ="log_03.xslt";

    QStringsrc3 =QString("122")+".doc";

 

    QProcess*proce =newQProcess( );

    QStringListargumentList;

    argumentList.append(src1 );

    argumentList.append(src2 );

    argumentList.append("-o");

    argumentList.append(src3 );

 

    proce->start(src, argumentList );

    bool ret =proce->waitForStarted( 5000 );

 必威手机官网 17

# Create a new document with no namespace uri, qualified name,
# or document type
document = implementation.createDocument(None,None,None)
personnel = document.createElement("personnel")
personnel.setAttribute('number', '5')
document.appendChild(personnel)
sexnode = document.createElement("sex")
sexnode.appendChild(document.createTextNode("male"))

xslt样式是个很有意思,也很强大的,现在用的很多,很方便就能做出一个漂亮的报告,可以百度一下,语法相当简单,跟写html差不多的.

实际情况是,这个xslt是通过GooSeeker的MS谋数台的直观标注功能自动生成的,熟练的话1分钟就搞定了。

namenode = document.createElement("name")
namenode.appendChild(document.createTextNode("tianbin"))

在这里可以定制好,我们要生成报告,是什么样子的,然后在从xml获取数据.

2、MS谋数台能做什么

personnel.appendChild(sexnode)
personnel.appendChild(namenode)

<?xml version="1.0" encoding="utf-8"?>

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:template match="/">
 <html>
 <Head>
        <style type="text/css">

          body {
          background:#fff;
          margin:0;
          padding:40px 20px;
          font-family: "Arial", Arial, Sans-serif;
          font-size: 16px;
          color:#000;
          }

          table {
          margin:5px 5px 0;
          border:0px solid #222;
          font-size: 0.8em;
          }

          td {
          margin:5px 5px 0;
          padding:10px 10px 10px 10px;
          vertical-align:text-top;
          border:1px solid #222;
          border-width:1px 1px 1px 1px;
          }

          td.light {
          border:0px solid #222;
          }

          td.number {
          text-align:right;
          }

          td.status {
          text-align:right;
          vertical-align:text-bottom;
          }

        </style>


 </Head>
 <body>
   <!--OVER RESULT -->
   <xsl:variable name="OVER_STATUS" select="REPORT/OVER_STATUS"/>
   <xsl:variable name="STATUS" select="REPORT/LOG_ENTRY/STATUS"/>



   <h2>自动化测试执行报告</h2>
   <!--table -->
   <table border="1">
     <!--all result value-->
     <tr bgcolor="white" height = "35">
        <td>Overall Test Result</td>
        <td><xsl:value-of select="$OVER_STATUS"/></td>
        <td colspan="2"> </td>
     </tr>

     <tr bgcolor="#D8BFD8" height = "35">
       <th>执行时间</th>
       <th>单步结果</th>
       <th>响应CODE</th>
       <th>Response信息</th>
     </tr>



       <!--select font color -->
       <xsl:variable name="fontColor">
           <xsl:choose>
               <xsl:when test="$STATUS = FAILED or $STATUS = PASSED">
                   <xsl:text>white</xsl:text>
               </xsl:when>
               <xsl:otherwise>black</xsl:otherwise>
           </xsl:choose>
       </xsl:variable>

       <!--background color-->
       <xsl:variable name="backgroundColor">
           <xsl:choose>
               <xsl:when test="$STATUS = 'FAILED'">
                   <xsl:text>rgb(255,0,0)</xsl:text>
               </xsl:when>
               <xsl:when test="$STATUS = 'PASSED'">
                   <xsl:text>rgb(60,179,113)</xsl:text>
               </xsl:when>
               <xsl:otherwise>
                   <xsl:text>white</xsl:text>
               </xsl:otherwise>
           </xsl:choose>
       </xsl:variable>

       <!--log entry-->
       <xsl:for-each select = "REPORT/LOG_ENTRY">


           <tr>
               <td><xsl:value-of select="EXECUTION_TIME"/></td>
               <td bgcolor="{$backgroundColor}"><xsl:value-of select="STEP_RESULT"/></td>
               <td><xsl:value-of select="COMPONENT_NAME"/></td>
               <td><xsl:value-of select="STEP_DESCRIPTION"/></td>
           </tr>
       </xsl:for-each>

       <tr bgcolor="white">
           <font color="{$fontColor}">
               <td colspan="4">Overall Test Result:<xsl:value-of select="$OVER_STATUS"/></td>
           </font>
       </tr>
   </table>
 </body>
 </html>
</xsl:template>
</xsl:stylesheet>

MS谋数台有个图形化界面,把一系列html解析工具集成在一起,包括:

out = open("tianbin.xml", "w")
xml.dom.ext.PrettyPrint(document,out)

xml是要按照,xslt定制的结构进行生成,或者换句话说,xslt样式要按照xml结构去做

  • 基于直观标注自动生成XSLT
  • 即时测试XSLT的正确性
  • 树状的DOM结构展示
  • 剖析某个DOM节点的属性
  • 为DOM节点生成XPath,可选择定位到class、或者id、或者绝对定位
  • 根据xpath搜索DOM节点

今天想使用python来创建一个xml文件。找了下资料,发现资料不是很多,基本上都是使用python来解析xml文件的。
比如我要将内容为

xml结构

MS谋数台界面分成三部分:DOM数窗口、内嵌浏览器窗口、工作台。在工作台上定义xslt转换规则。

复制代码 代码如下:

REPORT/LOG_ENTRY

3、用MS谋数台生成XSLT

<?xml version="1.0" encoding="utf-8"?>
<root>
<book isbn="34909023">
<author>
dikatour
</author>
</book>
</root>

REPORT下OVER_STATUS节点,这个是整个报告的结果,只有当所有条目为passed时才会为passed

假设我们要抓取论坛帖子列表,下面一步步讲解操作方法:
第一步,打开GooSeeker的MS谋数台,输入要抓取的网址
第二步,在MS谋数台的浏览器显示窗口里,直接选取要提取的内容,并且起个名字,点击确认

写入到xmlstuff.xml文件中去。
其实也很简单,基本原理如下:
我使用xml的DOM方式,先在内存中创建一个空的DOM树,然后不断增加我要的节点,最后形成我想要的DOM,最后输出到文件中去。
1.我使用xml.dom.minidom这个module来创建xml文件
from xml.dom import minidom

每个LOG_ENTRY节点,代表一行数据

必威手机官网 18

  1. 每个xml文件都是一个Document对象,代表着内存中的DOM树
    doc = minidom.Document()
    3.有了空的DOM树后,我们在上面添加根节点
    rootNode = doc.createElement("root")
    doc.appendChild(rootNode) #注意python的library reference里说,createElement后并没有将节点对象加到DOM树上,需要自己手工加上
    4.创建其它的节点
    5.输出到xml文件中去
    doc.writexml(f, "/t", "/t", "/n", "utf-8") #第一个参数f就是你的目标文件对象,第二个参数好像是<?xml>和下面一个根节点的缩进排列格式,
    第三个参数好像是其他节点与子节点的缩进排列格式,第四个参数制定了换行的格式(如果你填入" ",那就不换行了,所有的xml都缩在了一行上面 :) )
    ,第五个参数制定了xml内容的编码。除了第一个参数是必须的,其他参数都是可选择的。
    最终代码如下(这个程序没什么价值,只是用来测试验证自己的想法,你更可能定义一个简单类或函数,将你的数据结构序列化到xml文件中):

包括:

第三步,点击工作台的“测试”按钮,xslt就生成了,在“数据规则”窗口显示出来

复制代码 代码如下:

本文由必威发布于必威-编程,转载请注明出处:使用xml生成word的基本步骤在必威手机官网,1分钟

相关阅读