Doing another analysis based on the sqoop T243763: Run hadoop analysis on wb_terms migration for entities below 29 million to check state says we have even more holes than before. (48M now).
Here's an example from the database:
T243763#5838920
MariaDB [wikidatawiki_p]> SELECT wbit_item_id as id, wby_name as type, wbxl_language as language, wbx_text as text FROM wbt_item_terms LEFT JOIN wbt_term_in_lang ON wbit_term_in_lang_id = wbtl_id LEFT JOIN wbt_type ON wbtl_type_id = wby_id LEFT JOIN wbt_text_in_lang ON wbtl_text_in_lang_id = wbxl_id LEFT JOIN wbt_text ON wbxl_text_id = wbx_id WHERE wbit_item_id = 452581; -------- ------- ---------- -------------------------------- | id | type | language | text | -------- ------- ---------- -------------------------------- | 452581 | label | de | Asantehene | | 452581 | label | pl | Asantehene | | 452581 | label | en | list of rulers of Asante | | 452581 | label | lt | Asantehene | | 452581 | label | nl | Asantehene | | 452581 | label | ja | 君主 | | 452581 | label | ru | Ашантихене | | 452581 | alias | ja | アシャンティ王の一覧 | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | | 452581 | NULL | NULL | NULL | -------- ------- ---------- -------------------------------- 83 rows in set (0.01 sec)