Spaces:

TahaRasouli
/

Smart_AAS_v2.0

Sleeping

App Files Files Community

TahaRasouli commited on Nov 25, 2024

Commit

23f0de4

verified ·

1 Parent(s): 845e556

Update unified_document_processor.py

Browse files

Files changed (1) hide show

unified_document_processor.py +13 -6

unified_document_processor.py CHANGED Viewed

@@ -435,8 +435,10 @@ class UnifiedDocumentProcessor:
                     parent_path = '/'.join(result['source_info']['path'].split('/')[:-1])
                     if parent_path:
                         parent_filter = {
-                            'source_file': result['metadata']['source_file'],
-                            'xml_path': parent_path
                         }
                         parent_results = self.collection.query(
                             query_texts=[""],  # Empty query to get exact match
@@ -449,11 +451,14 @@ class UnifiedDocumentProcessor:
                                 'content': parent_results['documents'][0][0],
                                 'metadata': parent_results['metadatas'][0][0]
                             }
                     # Get immediate children
-                    child_path_prefix = result['source_info']['path'] + '/'
                     child_filter = {
-                        'source_file': result['metadata']['source_file'],
-                        'xml_path': {'$contains': child_path_prefix}
                     }
                     child_results = self.collection.query(
                         query_texts=[""],  # Empty query to get exact matches
@@ -465,7 +470,8 @@ class UnifiedDocumentProcessor:
                         result['children_info'] = [{
                             'content': doc,
                             'metadata': meta
-                        } for doc, meta in zip(child_results['documents'][0], child_results['metadatas'][0])]
                 hierarchical_results.append(result)
@@ -480,6 +486,7 @@ class UnifiedDocumentProcessor:
                 'success': False,
                 'error': str(e)
             }
     def get_summary_and_details(self, question: str, selected_files: List[str]) -> Dict:
         """Get both a summary answer and detailed supporting information"""
         try:

                     parent_path = '/'.join(result['source_info']['path'].split('/')[:-1])
                     if parent_path:
                         parent_filter = {
+                            '$and': [
+                                {'source_file': result['metadata']['source_file']},
+                                {'xml_path': parent_path}
+                            ]
                         }
                         parent_results = self.collection.query(
                             query_texts=[""],  # Empty query to get exact match
                                 'content': parent_results['documents'][0][0],
                                 'metadata': parent_results['metadatas'][0][0]
                             }
                     # Get immediate children
+                    child_path_prefix = result['source_info']['path']
                     child_filter = {
+                        '$and': [
+                            {'source_file': result['metadata']['source_file']},
+                            {'xml_path': {'$contains': child_path_prefix}}
+                        ]
                     }
                     child_results = self.collection.query(
                         query_texts=[""],  # Empty query to get exact matches
                         result['children_info'] = [{
                             'content': doc,
                             'metadata': meta
+                        } for doc, meta in zip(child_results['documents'][0], child_results['metadatas'][0])
+                        if meta['xml_path'] != result['source_info']['path']]  # Exclude self from children
                 hierarchical_results.append(result)
                 'success': False,
                 'error': str(e)
             }
     def get_summary_and_details(self, question: str, selected_files: List[str]) -> Dict:
         """Get both a summary answer and detailed supporting information"""
         try: