How to get text from textbox of MS word document using Apache POI? -


मैं एमएस वर्ड डॉक्युमेंट में टेक्स्टबॉक्स में लिखित जानकारी प्राप्त करना चाहता हूं। मैं शब्द दस्तावेज़ को पार्स करने के लिए अपाचे POI का उपयोग कर रहा हूं।

वर्तमान में मैं सभी पैराग्राफ ऑब्जेक्ट्स के माध्यम से फिर से चल रहा हूं, लेकिन इस अनुच्छेद सूची में टेक्स्ट बॉक्स से जानकारी नहीं है इसलिए मुझे इस जानकारी को आउटपुट में याद है। < सादा पाठ में पैराग्राफ ** & lt; पाठ बॉक्स में कुछ जानकारी & gt; ** सादे पाठ में एक और अनुच्छेद उदाहरण

  

मैं क्या निकालना चाहता हूं:

  & lt; पैरा & gt; पैराग्राफ़ सादा पाठ में & lt; / पैरा & gt; & Lt; text_box & gt; टेक्स्ट बॉक्स में कुछ जानकारी & lt; / text_box & gt; & Lt; पैरा & gt; सादा पाठ में एक और अनुच्छेद & lt; / पैरा & gt;   

मैं वर्तमान में क्या प्राप्त कर रहा हूं:

पैराग्राफ़ में सादा पाठ

सादे पाठ में एक और अनुच्छेद

कोई भी जानता है कि कैसे अपाचे POI का उपयोग कर पाठ बॉक्स से जानकारी निकाली जा सकती है?

यह काम मुझे,

  निजी शून्य printContentsOfTextBox (XWPFParagraph पैरा) {XmlObject [] textBoxObjects = paragraph.getCTP () selectPath ( "नाम स्थान w = 'घोषित http:। //schemas.openxmlformats.org/wordprocessingml / 2006 / मुख्य http 'नाम स्थान WPS = घोषित': //schemas.microsoft.com/office/word/2010/wordprocessingShape './/*/wps:txbx/w:txbxContent "); के लिए (इंट आई = 0; आई & lt; पाठ बॉक्स ऑब्जेक्ट। लैंघट; आई ++) {एक्सडब्ल्यूपीएफपीआरएपीआरपीआरपीपीईआरपी = नल; {XmlObject [] पैरा ऑब्जेक्ट्स = टेक्स्ट बॉक्स ऑब्जेक्ट [आई] का प्रयास करें चुने हुए बच्चे (नया क्यूएन ("http://schemas.openxmlformats.org/wordprocessingml/2006/main", "p")); (; J & LT; paraObjects.length; इंट जे = 0 J ++) के लिए {embeddedPara = नए XWPFParagraph (CTP.Factory.parse (paraObjects [जे] .xmlText ()), paragraph.getBody ()); // यहां आपका पैराग्राफ है; Println (embeddedPara.getText ()); }} पकड़ (XmlException ई) {// संभाल}}}    

Comments