<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {mso-style-priority:99;
        mso-style-link:"Balloon Text Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif";}
span.EmailStyle17
        {mso-style-type:personal;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
span.BalloonTextChar
        {mso-style-name:"Balloon Text Char";
        mso-style-priority:99;
        mso-style-link:"Balloon Text";
        font-family:"Tahoma","sans-serif";}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal"><span style="color:#1F497D">That should work.&nbsp; I just tried on
</span>8.0-1.1 on <span style="color:#1F497D">Windows and got the expected results.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">If you&#8217;re using CPF.&nbsp; Then you want to confirm you have the following pipelines enabled:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Status Change Handling<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Office OpenXML Extract<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">For Office 2007 and greater (docs ending with a .docx, .pptx. .xlsx extension) the file format is XML, and so you can unzip the contents and work with the native OpenXML Format directly once you&#8217;ve extracted
 the contents using &nbsp;the Office OpenXML Extract pipeline.&nbsp; <o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Once inserted, the original doc will be saved in MarkLogic as:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">/myDoc/UtilizationReport_xlsx&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //the original doc<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Once this original doc processed by Office OpenXML Extract, you should see the extracted parts in MarkLogic as well :<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">/myDoc/UtilizationReport_xlsx_parts&nbsp;&nbsp; //with a bunch of .xml here in SpreadsheetML format<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">The cpf state on the .xlsx will be: &nbsp;<a href="http://marklogic.com/states/extracted">http://marklogic.com/states/extracted</a><o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">If you already have those 2 pipelines enabled, you may want to disable others to see if you can get the expected results to insure no pipelines are conflicting with each other in their attempt to process the
 document.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Hope this helps,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Pete<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;">From:</span></b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"> general-bounces@developer.marklogic.com [mailto:general-bounces@developer.marklogic.com]
<b>On Behalf Of </b>Javier Lizarraga<br>
<b>Sent:</b> Thursday, March 26, 2015 7:51 PM<br>
<b>To:</b> General@developer.marklogic.com<br>
<b>Subject:</b> [MarkLogic Dev General] Converting MS Office documents<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Hello Developers,<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">I want to load an MS excel file with filename.xlsx into a MarkLogic database (using ML8).&nbsp; I want to be able to access the contents of the MS excel document.<o:p></o:p></p>
<p class="MsoNormal">I enabled the triggers for the database and installed &nbsp;and enabled the Content Processing.&nbsp; I followed the ML document below:<o:p></o:p></p>
<p class="MsoNormal"><a href="http://docs.marklogic.com/guide/cpf/default">http://docs.marklogic.com/guide/cpf/default#</a><o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Loaded:<o:p></o:p></p>
<p class="MsoNormal">declareUpdate();<o:p></o:p></p>
<p class="MsoNormal">xdmp.documentLoad(&quot;C:\\Users\\jlizarraga\\Documents\\UtilizationReport.xlsx&quot;,<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp; {<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &quot;uri&quot; : &quot;/myDoc/UtilizationReport.xlsx&quot;,<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &quot;permissions&quot; : xdmp.defaultPermissions()<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp; })<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">When I load my UtilizationReport.xlsx file I can see the associated properties in Query Console:<o:p></o:p></p>
<p class="MsoNormal">&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;<o:p></o:p></p>
<p class="MsoNormal">&lt;prop:properties xmlns:prop=&quot;<a href="http://marklogic.com/xdmp/property">http://marklogic.com/xdmp/property</a>&quot;&gt;<o:p></o:p></p>
<p class="MsoNormal">&nbsp; &lt;cpf:processing-status xmlns:cpf=&quot;<a href="http://marklogic.com/cpf">http://marklogic.com/cpf</a>&quot;&gt;done&lt;/cpf:processing-status&gt;<o:p></o:p></p>
<p class="MsoNormal">&nbsp; &lt;cpf:property-hash xmlns:cpf=&quot;<a href="http://marklogic.com/cpf">http://marklogic.com/cpf</a>&quot;&gt;d41d8cd98f00b204e9800998ecf8427e&lt;/cpf:property-hash&gt;<o:p></o:p></p>
<p class="MsoNormal">&nbsp; &lt;cpf:last-updated xmlns:cpf=&quot;<a href="http://marklogic.com/cpf">http://marklogic.com/cpf</a>&quot;&gt;2015-03-26T16:24:16-07:00&lt;/cpf:last-updated&gt;<o:p></o:p></p>
<p class="MsoNormal">&nbsp; &lt;cpf:state xmlns:cpf=&quot;<a href="http://marklogic.com/cpf">http://marklogic.com/cpf</a>&quot;&gt;<a href="http://marklogic.com/states/converted%3c/cpf:state">http://marklogic.com/states/converted&lt;/cpf:state</a>&gt;<o:p></o:p></p>
<p class="MsoNormal">&nbsp; &lt;cpf:self xmlns:cpf=&quot;<a href="http://marklogic.com/cpf">http://marklogic.com/cpf</a>&quot;&gt;/myDoc/UtilizationReport.xlsx&lt;/cpf:self&gt;<o:p></o:p></p>
<p class="MsoNormal">&lt;/prop:properties&gt;<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">It appears to me that it was successful but I do not see any other associated documents besides the UtilizationReport.xlsx file reference.<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal"><u>I was expecting to see:<o:p></o:p></u></p>
<p class="MsoNormal">UtilizationReport.xlsx&nbsp; (Original Document)<o:p></o:p></p>
<p class="MsoNormal"><span style="color:red">UtilizationReport_xlsx.xml<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:red">UtilizationReport_xlsx.xhtml<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:red">A Directory called UtilizationReport_xlsx_Parts<o:p></o:p></span></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">I don&#8217;t see any errors.&nbsp; Any help would be greatly appreciated.<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Thanks,<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Javier<o:p></o:p></p>
</div>
</body>
</html>