在此阶段可能导致错误的其他示例包括
Posted: Tue Dec 24, 2024 6:53 am
额外的列
错误的文件名
错误的列名称
嵌入列中的错误数据(如果您对该列进行排序并查看它,您会发现它)。
屏幕截图显示了 Screaming Frog 的 CSV 输出中空白单元格的示例错误。
例如,我在“Embeddings”列中遇到了一个导致错误的空白单元格。我只需删除该行,再次将清理后的文件导出为 file.csv,刷新 Google Colab 笔记本,然后重试。
保存结果并将其导入 Google 表格
处理完成后,我下载了生成的文件并将其导入到我现有的 Google Sheets 工作簿中,与“all_inlinks”选项卡一起。我将这个新选项卡命名为“相关页面”。
它看起来像这样:
Google 表格中“相关页面”标签 阿根廷电话号码库 的屏幕截图,显示目标网址及其最密切相关的前 5 个页面
拆分“相关页面”列
目标 URL 在 A 列,最密切相关的前 5 个 URL 在 B 列。
为了分离它们,我在单元格 C2 中使用了这个公式。
=SPLIT(SUBSTITUTE(B2,"[",""),", ")
Google 表格中使用“SPLIT”公式将相关 URL 分成单独列的屏幕截图
我将此公式复制到该列中,将 URL 拆分为 C 到 G 列。接下来,我将 C 到 G 列重命名为“相关 URL 1”到“相关 URL 5”。
复制并粘贴为值
复制 C 列至 G 列并将其粘贴回去作为“仅值”。
屏幕截图显示了 Google 表格中用于从“all_inlinks”选项卡中提取内部链接数据的公式
执行两个查找和替换操作:
删除所有单引号 (')
删除所有右括号 (])
错误的文件名
错误的列名称
嵌入列中的错误数据(如果您对该列进行排序并查看它,您会发现它)。
屏幕截图显示了 Screaming Frog 的 CSV 输出中空白单元格的示例错误。
例如,我在“Embeddings”列中遇到了一个导致错误的空白单元格。我只需删除该行,再次将清理后的文件导出为 file.csv,刷新 Google Colab 笔记本,然后重试。
保存结果并将其导入 Google 表格
处理完成后,我下载了生成的文件并将其导入到我现有的 Google Sheets 工作簿中,与“all_inlinks”选项卡一起。我将这个新选项卡命名为“相关页面”。
它看起来像这样:
Google 表格中“相关页面”标签 阿根廷电话号码库 的屏幕截图,显示目标网址及其最密切相关的前 5 个页面
拆分“相关页面”列
目标 URL 在 A 列,最密切相关的前 5 个 URL 在 B 列。
为了分离它们,我在单元格 C2 中使用了这个公式。
=SPLIT(SUBSTITUTE(B2,"[",""),", ")
Google 表格中使用“SPLIT”公式将相关 URL 分成单独列的屏幕截图
我将此公式复制到该列中,将 URL 拆分为 C 到 G 列。接下来,我将 C 到 G 列重命名为“相关 URL 1”到“相关 URL 5”。
复制并粘贴为值
复制 C 列至 G 列并将其粘贴回去作为“仅值”。
屏幕截图显示了 Google 表格中用于从“all_inlinks”选项卡中提取内部链接数据的公式
执行两个查找和替换操作:
删除所有单引号 (')
删除所有右括号 (])