databrickslabs · nfx · Oct 11, 2024 · Oct 11, 2024 · Oct 11, 2024 · Oct 11, 2024
@@ -262,27 +262,23 @@ def collect_tables(self, source_code: str) -> Iterable[UsedTable]: ...
 
 
 @dataclass
-class TableInfoNode:
+class UsedTableNode:
     table: UsedTable
     node: NodeNG
 
 
 class TablePyCollector(TableCollector, ABC):
 
-    def collect_tables(self, source_code: str):
+    def collect_tables(self, source_code: str) -> Iterable[UsedTable]:
         try:
             tree = Tree.normalize_and_parse(source_code)
             for table_node in self.collect_tables_from_tree(tree):
-                # see https://github.com/databrickslabs/ucx/issues/2887
-                if isinstance(table_node, UsedTable):
-                    yield table_node
-                else:
-                    yield table_node.table
+                yield table_node.table
         except AstroidSyntaxError as e:
             logger.warning('syntax-error', exc_info=e)
 
     @abstractmethod
-    def collect_tables_from_tree(self, tree: Tree) -> Iterable[TableInfoNode]: ...
+    def collect_tables_from_tree(self, tree: Tree) -> Iterable[UsedTableNode]: ...
 
 
 class TableSqlCollector(TableCollector, ABC): ...
@@ -458,16 +454,11 @@ def collect_tables(self, source_code: str) -> Iterable[UsedTable]:
         try:
             tree = self._parse_and_append(source_code)
             for table_node in self.collect_tables_from_tree(tree):
-                # there's a bug in the code that causes this to be necessary
-                # see https://github.com/databrickslabs/ucx/issues/2887
-                if isinstance(table_node, UsedTable):
-                    yield table_node
-                else:
-                    yield table_node.table
+                yield table_node.table
         except AstroidSyntaxError as e:
             logger.warning('syntax-error', exc_info=e)
 
-    def collect_tables_from_tree(self, tree: Tree) -> Iterable[TableInfoNode]:
+    def collect_tables_from_tree(self, tree: Tree) -> Iterable[UsedTableNode]:
         for collector in self._table_collectors:
             yield from collector.collect_tables_from_tree(tree)
 

@@ -15,7 +15,7 @@
     SqlLinter,
     Fixer,
     UsedTable,
-    TableInfoNode,
+    UsedTableNode,
     TablePyCollector,
     TableSqlCollector,
     DfsaPyCollector,
@@ -388,14 +388,14 @@ def _find_matcher(self, node: NodeNG):
             return None
         return matcher if matcher.matches(node) else None
 
-    def collect_tables_from_tree(self, tree: Tree) -> Iterable[TableInfoNode]:
+    def collect_tables_from_tree(self, tree: Tree) -> Iterable[UsedTableNode]:
         for node in tree.walk():
             matcher = self._find_matcher(node)
             if matcher is None:
                 continue
             assert isinstance(node, Call)
             for used_table in matcher.collect_tables(self._from_table, self._index, self._session_state, node):
-                yield TableInfoNode(used_table, node)  # B
+                yield UsedTableNode(used_table, node)
 
 
 class _SparkSqlAnalyzer:
@@ -468,11 +468,11 @@ class SparkSqlTablePyCollector(_SparkSqlAnalyzer, TablePyCollector):
     def __init__(self, sql_collector: TableSqlCollector):
         self._sql_collector = sql_collector
 
-    def collect_tables_from_tree(self, tree: Tree) -> Iterable[TableInfoNode]:
+    def collect_tables_from_tree(self, tree: Tree) -> Iterable[UsedTableNode]:
         assert self._sql_collector
         for call_node, query in self._visit_call_nodes(tree):
             for value in InferredValue.infer_from_node(query):
                 if not value.is_inferred():
                     continue  # TODO error handling strategy
                 for table in self._sql_collector.collect_tables(value.as_string()):
-                    yield TableInfoNode(table, call_node)  # A
+                    yield UsedTableNode(table, call_node)
@@ -0,0 +1,11 @@
+# Databricks notebook source
+# ucx[default-format-changed-in-dbr8:+1:0:+1:18] The default format changed in Databricks Runtime 8.0, from Parquet to Delta
+spark.table("a.b").count()
+spark.sql("SELECT * FROM b.c LEFT JOIN c.d USING (e)")
+%sql SELECT * FROM b.c LEFT JOIN c.d USING (e)
+
+# COMMAND ----------
+
+# MAGIC %sql
+# MAGIC SELECT * FROM b.c LEFT JOIN c.d USING (e)
+
@@ -0,0 +1,12 @@
+-- Databricks notebook source
+
+SELECT * FROM b.c LEFT JOIN c.d USING (e)
+
+-- COMMAND ----------
+
+-- MAGIC %python
+-- ucx[default-format-changed-in-dbr8:+1:0:+1:18] The default format changed in Databricks Runtime 8.0, from Parquet to Delta
+-- MAGIC spark.table("a.b").count()
+-- MAGIC spark.sql("SELECT * FROM b.c LEFT JOIN c.d USING (e)")
+
+