{ "cells": [ { "cell_type": "code", "execution_count": 2, "metadata": { "collapsed": true }, "outputs": [], "source": [ "############################################################\n", "#Author : Bhagyashree\n", "#Date : 1st Sept, 2020\n", "#Purpose : Text Cleaning\n", "#Input : Text file after timestamp removal\n", "#Output : Text file after cleaning data\n", "############################################################" ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "collapsed": true }, "outputs": [], "source": [ "import nltk\n", "import numpy\n", "import xlrd\n", "import openpyxl \n", "import re" ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "अब हम ऑलट्रेशन ऑफ मेमोरेंडम के बारे में बात करेंगे।\n", " मेमोरेंडम के विषयों को बदल दिया जा सकता है।\n", "कंपनी अधिनियम 1956 के तहत\n", "निम्नलिखित प्रक्रिया के अनुसार\n", "यदि कोई कंपनी अपना नाम बदलना चाहती है,\n", "तो वे विशेष संकल्प में ऐसा कर सकती है।\n", "और केंद्र सरकार की मंजूरी के साथ\n", "लिखित में\n", "हालाँकि, ऐसी किसी भी मंजूरी की आवश्यकता नहीं होती है\n", "केवल कंपनी के नाम में परिवर्तन के लिए\n", "बल्कि यह प्रक्रिया\n", "पूरी तरह से निजी शब्द को हटाने के लिए होती है।\n", "तो इस मामले में\n", "एक सार्वजनिक कंपनी को एक निजी कंपनी के संबंध में,\n", "या एक निजी कंपनी को एक सार्वजनिक कंपनी में परिवर्तित करने\n", "दूसरी जगह पर पंजीकृत कार्यालय का दोबारा परिवर्तन किया जाना है\n", "अगर एक ही शहर, कस्बे\n", "या गाँव में एक जगह से\n", "30 दिनों का नोटिस दिया जाना होता है।\n", "यह रजिस्ट्रार द्वारा परिवर्तन की तिथि के बाद\n", "होगा जो उसी को दर्ज करेगा।\n", "पंजीकृत कार्यालय के परिवर्तन के मामले में\n", "जबकि एक ही राज्य में 1 शहर से दूसरे शहर में,\n", "विशेष प्रस्ताव पारित किया जाना आवश्यक है।\n", "शेयरधारकों की आम बैठक में\n", "और इसकी एक प्रति रजिस्ट्रार के पास कार्यालय को\n", "30 दिनों के भीतर बदलने के दाखिल करनी होगी।\n", "नोटिस देना होगा।\n", "रजिस्ट्रार को कार्यालय के नये पते का\n", "तब तक परिवर्तन प्रभावी नहीं होगा।\n", "जब तक केंद्र सरकार द्वारा प्रस्ताव की पुष्टि नहीं हो जाती\n", "कंपनी किसी भी आधार पर\n", "उपधारा 1 से\n", "उपधारा 7 में धारा 17 तक उल्लेखित है।\n", "जैसा कि अधिनियम के बाद ही परिवर्तन प्रभावी होगा।\n", "अपने उद्देश्यों में बदलाव कर सकती है\n", "सामान्य बैठक में सदस्यों द्वारा\n", "कंपनी संशोधन अधिनियम 1996 को मेमोरेंडम ऑफ एसोसिएशन के\n", "केंद्र सरकार के प्रतिबंध के साथ समाप्त कर दिया गया है।\n", "विशेष संकल्प के अनुरूप अनुमोदित किए जाने\n", "ऑब्जेक्ट क्लॉज में परिवर्तन के प्रति शेयर पूंजी में\n", "परिवर्तन की प्रक्रिया और ऐसे परिवर्तन करने के अधिकार।\n", "समान्य पहलु को आर्टीकल ऑफ एसोसिएशन में रखा गया है।\n", "यदि संबंधित विषय के\n", " आर्टीकल ऑफ एसोसिएशन में पीछे की प्रक्रिया नहीं दी गई है।\n", "कंपनी को पारित करके आर्टीकल ऑफ एसोसिएशन को बदलना होगा।\n", "एक विशेष प्रस्ताव\n", "अब, हम ऑलट्रेशन ऑफ पर चर्चा करेंगे।\n", "कंपनी अधिनियम 2013 के तहत मेमोरेंडम\n", "अधिनियम की धारा 16, 17, 18, 19,\n", "1956 के कंपनी 21, 23 और 37 के अनुरूप।\n", "कंपनी अधिनियम, 2013 की धारा 13 ने\n", " ऑलट्रेशन ऑफ मेमोरेंडम के लिए मानदंड निर्धारित किए हैं।\n", "यह वही वर्णन करता है कि जैसा कि धारा 61 में दिया गया है।\n", "एक कंपनी विशेष संकल्प द्वारा\n", "और प्रावधानों को बदल सकती है।\n", "निर्दिष्ट प्रक्रिया के अनुपालन से मेमोरेंडम\n", "नाम खंड के परिवर्तन के संबंध में,\n", "कंपनी अपना नाम बदल सकती है।\n", "अनुमोदन के बाद लिखित रूप में केंद्र सरकार द्वारा\n", "इसलिए जब कंपनी के नाम में कोई बदलाव किया जाता है,\n", "रजिस्टर में दर्ज करेगा।\n", " तो रजिस्ट्रार कंपनी के नया नाम\n", "पुराने नाम के स्थान पर\n", "निगमन का एक नया प्रमाणपत्र जारी करेगा।\n", "कंपनी के पंजीकृत कार्यालय के बारे में\n", "जैसा कि पहले उल्लेख किया गया है,\n", "तब तक कोई प्रभाव नहीं पड़ेगा जब तक कि वह केंद्र सरकार द्वारा अनुमोदित नहीं हो जाता।\n", "ऑब्जेक्ट क्लॉज के किसी भी परिवर्तन के संबंध में,\n", "किसी कंपनी के मेमोरेंडम के\n", "रजिस्ट्रार को दाखिल करने की\n", "30 दिनों की अवधि के भीतर\n", "तारीख से पंजीकरण को प्रमाणित करना होता है।\n", "इस विशेष प्रस्ताव खंड के उप खंड 6 के खंड A के अनुसार\n", "चलिए फिर से संक्षेप में\n", " ऑलट्रेशन ऑफ मेमोरेंडम के महत्व के बारे में चर्चा करते हैं\n", " क्योंकि ये इस मॉड्यूल के अध्ययन का एक बहुत महत्वपूर्ण हिस्सा है।\n", "पहला महत्व यह है\n", "कि यह एक बहुत ही आवश्यक दस्तावेज है।\n", "एक कंपनी के निगमन के लिए\n", "दूसरा, यह कंपनी के पंजीकृत कार्यालय को निर्दिष्ट करते हुए\n", "रजिस्ट्रार और अदालत के अधिकार क्षेत्र को निर्धारित करता है।\n", "तीसरा, यह कंपनी के अधिकारों में उद्देश्यों को\n", "जनता की जानकारी के लिए दर्ज करता है।\n", "अगला, यह कंपनी को केवल उन कृत्यों को करने के लिए\n", "बाध्य करता है जो कंपनी के ऑब्जेक्ट क्लॉज में शामिल हैं।\n", "यह कंपनी की अधिकृत कैपिटल\n", "और उसके विभाजन को निश्चित राशि के शेयरों में निर्दिष्ट करता है।\n", "पर प्रकाश डालता है।\n", "यह कंपनी के सदस्यों के लायबिलिटी\n", "अंत में, संघ के नियमों को\n", "यह एक कंपनी के भी नियंत्रित करता है।\n" ] } ], "source": [ "file1 = open(\"recent_deliverables_dec2020/Corporate_Law/Hindi/ankita objects 02_Hindi_new.txt\",\"r+\",encoding='utf-8') \n", "data = file1.read()\n", "print(data)\n", "file1.close()" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "अब हम ऑलट्रेशन ऑफ मेमोरेंडम के बारे में बात करेंगे\n", " मेमोरेंडम के विषयों को बदल दिया जा सकता है\n", "कंपनी अधिनियम वन नाइन फाइव सिक्स के तहत\n", "निम्नलिखित प्रक्रिया के अनुसार\n", "यदि कोई कंपनी अपना नाम बदलना चाहती है\n", "तो वे विशेष संकल्प में ऐसा कर सकती है\n", "और केंद्र सरकार की मंजूरी के साथ\n", "लिखित में\n", "हालाँकि ऐसी किसी भी मंजूरी की आवश्यकता नहीं होती है\n", "केवल कंपनी के नाम में परिवर्तन के लिए\n", "बल्कि यह प्रक्रिया\n", "पूरी तरह से निजी शब्द को हटाने के लिए होती है\n", "तो इस मामले में\n", "एक सार्वजनिक कंपनी को एक निजी कंपनी के संबंध में\n", "या एक निजी कंपनी को एक सार्वजनिक कंपनी में परिवर्तित करने\n", "दूसरी जगह पर पंजीकृत कार्यालय का दोबारा परिवर्तन किया जाना है\n", "अगर एक ही शहर कस्बे\n", "या गाँव में एक जगह से\n", " थ्री ज़ीरो दिनों का नोटिस दिया जाना होता है\n", "यह रजिस्ट्रार द्वारा परिवर्तन की तिथि के बाद\n", "होगा जो उसी को दर्ज करेगा\n", "पंजीकृत कार्यालय के परिवर्तन के मामले में\n", "जबकि एक ही राज्य में वन शहर से दूसरे शहर में\n", "विशेष प्रस्ताव पारित किया जाना आवश्यक है\n", "शेयरधारकों की आम बैठक में\n", "और इसकी एक प्रति रजिस्ट्रार के पास कार्यालय को\n", " थ्री ज़ीरो दिनों के भीतर बदलने के दाखिल करनी होगी\n", "नोटिस देना होगा\n", "रजिस्ट्रार को कार्यालय के नये पते का\n", "तब तक परिवर्तन प्रभावी नहीं होगा\n", "जब तक केंद्र सरकार द्वारा प्रस्ताव की पुष्टि नहीं हो जाती\n", "कंपनी किसी भी आधार पर\n", "उपधारा वन से\n", "उपधारा सेवेन में धारा वन सेवेन तक उल्लेखित है\n", "जैसा कि अधिनियम के बाद ही परिवर्तन प्रभावी होगा\n", "अपने उद्देश्यों में बदलाव कर सकती है\n", "सामान्य बैठक में सदस्यों द्वारा\n", "कंपनी संशोधन अधिनियम वन नाइन नाइन सिक्स को मेमोरेंडम ऑफ एसोसिएशन के\n", "केंद्र सरकार के प्रतिबंध के साथ समाप्त कर दिया गया है\n", "विशेष संकल्प के अनुरूप अनुमोदित किए जाने\n", "ऑब्जेक्ट क्लॉज में परिवर्तन के प्रति शेयर पूंजी में\n", "परिवर्तन की प्रक्रिया और ऐसे परिवर्तन करने के अधिकार\n", "समान्य पहलु को आर्टीकल ऑफ एसोसिएशन में रखा गया है\n", "यदि संबंधित विषय के\n", " आर्टीकल ऑफ एसोसिएशन में पीछे की प्रक्रिया नहीं दी गई है\n", "कंपनी को पारित करके आर्टीकल ऑफ एसोसिएशन को बदलना होगा\n", "एक विशेष प्रस्ताव\n", "अब हम ऑलट्रेशन ऑफ पर चर्चा करेंगे\n", "कंपनी अधिनियम टू ज़ीरो वन थ्री के तहत मेमोरेंडम\n", "अधिनियम की धारा वन सिक्स वन सेवेन वन ऐइट वन नाइन \n", " वन नाइन फाइव सिक्स के कंपनी टू वन टू थ्री और थ्री सेवेन के अनुरूप\n", "कंपनी अधिनियम टू ज़ीरो वन थ्री की धारा वन थ्री ने\n", " ऑलट्रेशन ऑफ मेमोरेंडम के लिए मानदंड निर्धारित किए हैं\n", "यह वही वर्णन करता है कि जैसा कि धारा सिक्स वन में दिया गया है\n", "एक कंपनी विशेष संकल्प द्वारा\n", "और प्रावधानों को बदल सकती है\n", "निर्दिष्ट प्रक्रिया के अनुपालन से मेमोरेंडम\n", "नाम खंड के परिवर्तन के संबंध में\n", "कंपनी अपना नाम बदल सकती है\n", "अनुमोदन के बाद लिखित रूप में केंद्र सरकार द्वारा\n", "इसलिए जब कंपनी के नाम में कोई बदलाव किया जाता है\n", "रजिस्टर में दर्ज करेगा\n", " तो रजिस्ट्रार कंपनी के नया नाम\n", "पुराने नाम के स्थान पर\n", "निगमन का एक नया प्रमाणपत्र जारी करेगा\n", "कंपनी के पंजीकृत कार्यालय के बारे में\n", "जैसा कि पहले उल्लेख किया गया है\n", "तब तक कोई प्रभाव नहीं पड़ेगा जब तक कि वह केंद्र सरकार द्वारा अनुमोदित नहीं हो जाता\n", "ऑब्जेक्ट क्लॉज के किसी भी परिवर्तन के संबंध में\n", "किसी कंपनी के मेमोरेंडम के\n", "रजिस्ट्रार को दाखिल करने की\n", " थ्री ज़ीरो दिनों की अवधि के भीतर\n", "तारीख से पंजीकरण को प्रमाणित करना होता है\n", "इस विशेष प्रस्ताव खंड के उप खंड सिक्स के खंड ए के अनुसार\n", "चलिए फिर से संक्षेप में\n", " ऑलट्रेशन ऑफ मेमोरेंडम के महत्व के बारे में चर्चा करते हैं\n", " क्योंकि ये इस मॉड्यूल के अध्ययन का एक बहुत महत्वपूर्ण हिस्सा है\n", "पहला महत्व यह है\n", "कि यह एक बहुत ही आवश्यक दस्तावेज है\n", "एक कंपनी के निगमन के लिए\n", "दूसरा यह कंपनी के पंजीकृत कार्यालय को निर्दिष्ट करते हुए\n", "रजिस्ट्रार और अदालत के अधिकार क्षेत्र को निर्धारित करता है\n", "तीसरा यह कंपनी के अधिकारों में उद्देश्यों को\n", "जनता की जानकारी के लिए दर्ज करता है\n", "अगला यह कंपनी को केवल उन कृत्यों को करने के लिए\n", "बाध्य करता है जो कंपनी के ऑब्जेक्ट क्लॉज में शामिल हैं\n", "यह कंपनी की अधिकृत कैपिटल\n", "और उसके विभाजन को निश्चित राशि के शेयरों में निर्दिष्ट करता है\n", "पर प्रकाश डालता है\n", "यह कंपनी के सदस्यों के लायबिलिटी\n", "अंत में संघ के नियमों को\n", "यह एक कंपनी के भी नियंत्रित करता है\n" ] } ], "source": [ "\n", "wb_obj = openpyxl.load_workbook(\"charmap_v2_new.xlsx\") \n", "sheet_obj = wb_obj.active \n", "\n", "#data = re.sub('[A-Z]*', '',data)\n", "#print(data)\n", "data = data.replace('?','')\n", "data = data.replace(' ',' ')\n", "data = data.replace(';','')\n", "data = data.replace(')','')\n", "data = data.replace('(','')\n", "data = data.replace('!','')\n", "data = data.replace(' – ',' ')\n", "data = data.replace('-',' ')\n", "data = data.replace('।','')\n", "data = data.replace('&','')\n", "data = data.replace('’','')\n", "data = data.replace('‘','')\n", "data = data.replace(':','')\n", "data = data.replace(',','')\n", "data = data.replace('/','')\n", "data = data.replace(',','')\n", "data = data.replace('.','')\n", "data = data.replace('|','')\n", "m_row = sheet_obj.max_row \n", "line = data\n", "\n", "for i in range(1,m_row+1):\n", " num = sheet_obj.cell(row = i, column = 1).value \n", " word = sheet_obj.cell(row = i, column = 2).value\n", " #print(num)\n", " #print(word)\n", " line = line.replace(str(num), word)\n", "#print(line)\n", "#' '.join(line.split())\n", "print(line) \n", "file1 = open(\"recent_deliverables_dec2020/Corporate_Law/Hindi/ankita objects 02_Hindi.txt\",\"w+\",encoding='utf-8') \n", "file1.write(line)\n", "file1.close()" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.3" } }, "nbformat": 4, "nbformat_minor": 2 }