Python 的新 t-strings

模板字符串（也称为 t-strings）已被正式接受为 Python 3.14 的一项功能，该版本将于 2025 年底发布。

我很兴奋；t-strings 为 Python 中更安全、更灵活的字符串处理打开了大门。

t-strings 有什么重大意义？

自 Python 3.6 引入以来，f-strings 已成为一种非常流行的字符串格式化方式。它们简洁、易读且功能强大。

事实上，它们是如此讨人喜欢，以至于许多开发人员在任何情况下都使用 f-strings ……即使在不应该使用它们的时候！

唉，f-字符串经常被危险地（错误地）用于格式化包含用户输入的字符串。我见过将 f 字符串用于 SQL（f “SELECT * FROM users WHERE name = ‘{user_name}’”）和 HTML（f“<div>{user_name}</div>”）。这些字符串并不安全！如果 user_name 包含恶意值，就会导致 SQL 注入或跨站脚本攻击。

元素周期表

模板字符串是对 Python 的 f-strings 的概括。f-strings 会立即变成字符串，而 t-strings 则会评估为一种新类型 string.templatelib.Template：

from string.templatelib import Template
name = "World"
template: Template = t"Hello {name}!"

重要的是，Template实例不是字符串。Template类型不提供自己的 __str__() 实现，也就是说，调用 str(my_template) 不会返回有用的值。模板在使用前必须经过处理；处理代码可以由开发者编写，也可以由库提供，并且可以安全地转义动态内容。

我们可以想象一个提供 html() 函数的程序库，该函数接收一个Template 并返回一个安全转义的字符串：

evil = "<script>alert('bad')</script>"
template = t"<p>{evil}</p>"
safe = html(template)
assert safe == "<p>&lt;script&gt;alert('bad')&lt;/script&gt;</p>"

当然，t-strings 的作用不仅仅是安全，它还能实现更灵活的字符串处理。例如，html() 函数可以返回一种新类型 HTMLElement。它还可以在 HTML 本身中接受各种有用的替换：

attributes = {"src": "roquefort.jpg", "alt": "Yum"}
template = t"<img {attributes} />"
element = html(template)
assert str(element) == "<img src='roquefort.jpg' alt='Yum' />"

如果你使用过 JavaScript，可能会对 t-strings 感到熟悉。它们与 JavaScript 的标记模板类似。

如何使用 t 字符串？

为了支持处理，Templates 允许开发人员访问字符串及其插值，然后再将它们组合成最终字符串。

Template 的 .strings 和 .values 属性会返回元组：

name = "World"
template = t"Hello {name}!"
assert template.strings == ("Hello ", "!")
assert template.values == (name,)

字符串总是比值多一个（可能为空）。也就是说，t“”.strings == (“”,) 和 t“{name}”.strings == (“”, “”) 。

作为快捷方式，也可以遍历Template：

name = "World"
template = t"Hello {name}!"
contents = list(template)
assert contents[0] == "Hello "
assert contents[1].value == name
assert contents[2] == "!"

编写复杂处理代码的开发人员也可以访问每个插值的细节：

name = "World"
template = t"Hello {name!s:>8}!"
assert template.interpolations[0].value == name
assert template.interpolations[0].expression == "name"
assert template.interpolations[0].conversion == "s"
assert template.interpolations[0].format_spec == ">8"

除了支持字面形式（t “foo”）外，Template 还可以直接实例化：

from string.templatelib import Template, Interpolation
template = Template(
	"Hello ",
	Interpolation(value="World", expression="name"),
	"!"
)

字符串和插值可以任意顺序提供给Template 构造函数。

一个简单的 t-string 示例

假设我们想编写代码，将所有替换的单词转换成猪拉丁文。这只需要一个简单的函数：

def pig_latin(template: Template) -> str:
	"""Convert a Template to pig latin."""
	result = []
	for item in template:
		if isinstance(item, str):
			result.append(item)
		else:
			word = item.value
			if word and word[0] in "aeiou":
				result.append(word + "yay")
			else:
				result.append(word[1:] + word[0] + "ay")
	return "".join(result)

name = "world"
template = t"Hello {name}!"
assert pig_latin(template) == "Hello orldway!"

这是一个愚蠢的例子；如果你想看一些不那么愚蠢的例子，请查看 PEP 750 示例库。

t-strings 发布后的下一步是什么？

t-string 是一个强大的新特性，它将使 Python 字符串处理更安全、更灵活。我希望看到它们被用于各种库和框架，尤其是那些处理用户输入的库和框架。

此外，我希望工具生态系统也能支持 t-strings。例如，我希望看到black 和 ruff格式的 t-string 内容，如果它们是 HTML 或 SQL 等常见类型，vscode 还能为它们着色。

能在这个项目中认识 Jim、Paul、Koudai、Lysandros 和 Guido 并与他们一起工作，以及与 Python 社区中更多的在线成员交流，是一件非常有趣的事情。我迫不及待地想看到 t-strings 发布后，开发者们会用它来构建什么！

阅读余下内容

python| 2025-04-22